[NETFILTER]: Handle NAT module load race
[linux-3.10.git] / net / ipv4 / netfilter / ip_nat_rule.c
1 /* (C) 1999-2001 Paul `Rusty' Russell
2  * (C) 2002-2004 Netfilter Core Team <coreteam@netfilter.org>
3  *
4  * This program is free software; you can redistribute it and/or modify
5  * it under the terms of the GNU General Public License version 2 as
6  * published by the Free Software Foundation.
7  */
8
9 /* Everything about the rules for NAT. */
10 #include <linux/types.h>
11 #include <linux/ip.h>
12 #include <linux/netfilter.h>
13 #include <linux/netfilter_ipv4.h>
14 #include <linux/module.h>
15 #include <linux/kmod.h>
16 #include <linux/skbuff.h>
17 #include <linux/proc_fs.h>
18 #include <net/checksum.h>
19 #include <net/route.h>
20 #include <linux/bitops.h>
21
22 #define ASSERT_READ_LOCK(x)
23 #define ASSERT_WRITE_LOCK(x)
24
25 #include <linux/netfilter_ipv4/ip_tables.h>
26 #include <linux/netfilter_ipv4/ip_nat.h>
27 #include <linux/netfilter_ipv4/ip_nat_core.h>
28 #include <linux/netfilter_ipv4/ip_nat_rule.h>
29 #include <linux/netfilter_ipv4/listhelp.h>
30
31 #if 0
32 #define DEBUGP printk
33 #else
34 #define DEBUGP(format, args...)
35 #endif
36
37 #define NAT_VALID_HOOKS ((1<<NF_IP_PRE_ROUTING) | (1<<NF_IP_POST_ROUTING) | (1<<NF_IP_LOCAL_OUT))
38
39 static struct
40 {
41         struct ipt_replace repl;
42         struct ipt_standard entries[3];
43         struct ipt_error term;
44 } nat_initial_table __initdata
45 = { { "nat", NAT_VALID_HOOKS, 4,
46       sizeof(struct ipt_standard) * 3 + sizeof(struct ipt_error),
47       { [NF_IP_PRE_ROUTING] = 0,
48         [NF_IP_POST_ROUTING] = sizeof(struct ipt_standard),
49         [NF_IP_LOCAL_OUT] = sizeof(struct ipt_standard) * 2 },
50       { [NF_IP_PRE_ROUTING] = 0,
51         [NF_IP_POST_ROUTING] = sizeof(struct ipt_standard),
52         [NF_IP_LOCAL_OUT] = sizeof(struct ipt_standard) * 2 },
53       0, NULL, { } },
54     {
55             /* PRE_ROUTING */
56             { { { { 0 }, { 0 }, { 0 }, { 0 }, "", "", { 0 }, { 0 }, 0, 0, 0 },
57                 0,
58                 sizeof(struct ipt_entry),
59                 sizeof(struct ipt_standard),
60                 0, { 0, 0 }, { } },
61               { { { { IPT_ALIGN(sizeof(struct ipt_standard_target)), "" } }, { } },
62                 -NF_ACCEPT - 1 } },
63             /* POST_ROUTING */
64             { { { { 0 }, { 0 }, { 0 }, { 0 }, "", "", { 0 }, { 0 }, 0, 0, 0 },
65                 0,
66                 sizeof(struct ipt_entry),
67                 sizeof(struct ipt_standard),
68                 0, { 0, 0 }, { } },
69               { { { { IPT_ALIGN(sizeof(struct ipt_standard_target)), "" } }, { } },
70                 -NF_ACCEPT - 1 } },
71             /* LOCAL_OUT */
72             { { { { 0 }, { 0 }, { 0 }, { 0 }, "", "", { 0 }, { 0 }, 0, 0, 0 },
73                 0,
74                 sizeof(struct ipt_entry),
75                 sizeof(struct ipt_standard),
76                 0, { 0, 0 }, { } },
77               { { { { IPT_ALIGN(sizeof(struct ipt_standard_target)), "" } }, { } },
78                 -NF_ACCEPT - 1 } }
79     },
80     /* ERROR */
81     { { { { 0 }, { 0 }, { 0 }, { 0 }, "", "", { 0 }, { 0 }, 0, 0, 0 },
82         0,
83         sizeof(struct ipt_entry),
84         sizeof(struct ipt_error),
85         0, { 0, 0 }, { } },
86       { { { { IPT_ALIGN(sizeof(struct ipt_error_target)), IPT_ERROR_TARGET } },
87           { } },
88         "ERROR"
89       }
90     }
91 };
92
93 static struct ipt_table nat_table = {
94         .name           = "nat",
95         .valid_hooks    = NAT_VALID_HOOKS,
96         .lock           = RW_LOCK_UNLOCKED,
97         .me             = THIS_MODULE,
98 };
99
100 /* Source NAT */
101 static unsigned int ipt_snat_target(struct sk_buff **pskb,
102                                     const struct net_device *in,
103                                     const struct net_device *out,
104                                     unsigned int hooknum,
105                                     const void *targinfo,
106                                     void *userinfo)
107 {
108         struct ip_conntrack *ct;
109         enum ip_conntrack_info ctinfo;
110         const struct ip_nat_multi_range_compat *mr = targinfo;
111
112         IP_NF_ASSERT(hooknum == NF_IP_POST_ROUTING);
113
114         ct = ip_conntrack_get(*pskb, &ctinfo);
115
116         /* Connection must be valid and new. */
117         IP_NF_ASSERT(ct && (ctinfo == IP_CT_NEW || ctinfo == IP_CT_RELATED
118                             || ctinfo == IP_CT_RELATED + IP_CT_IS_REPLY));
119         IP_NF_ASSERT(out);
120
121         return ip_nat_setup_info(ct, &mr->range[0], hooknum);
122 }
123
124 /* Before 2.6.11 we did implicit source NAT if required. Warn about change. */
125 static void warn_if_extra_mangle(u32 dstip, u32 srcip)
126 {
127         static int warned = 0;
128         struct flowi fl = { .nl_u = { .ip4_u = { .daddr = dstip } } };
129         struct rtable *rt;
130
131         if (ip_route_output_key(&rt, &fl) != 0)
132                 return;
133
134         if (rt->rt_src != srcip && !warned) {
135                 printk("NAT: no longer support implicit source local NAT\n");
136                 printk("NAT: packet src %u.%u.%u.%u -> dst %u.%u.%u.%u\n",
137                        NIPQUAD(srcip), NIPQUAD(dstip));
138                 warned = 1;
139         }
140         ip_rt_put(rt);
141 }
142
143 static unsigned int ipt_dnat_target(struct sk_buff **pskb,
144                                     const struct net_device *in,
145                                     const struct net_device *out,
146                                     unsigned int hooknum,
147                                     const void *targinfo,
148                                     void *userinfo)
149 {
150         struct ip_conntrack *ct;
151         enum ip_conntrack_info ctinfo;
152         const struct ip_nat_multi_range_compat *mr = targinfo;
153
154         IP_NF_ASSERT(hooknum == NF_IP_PRE_ROUTING
155                      || hooknum == NF_IP_LOCAL_OUT);
156
157         ct = ip_conntrack_get(*pskb, &ctinfo);
158
159         /* Connection must be valid and new. */
160         IP_NF_ASSERT(ct && (ctinfo == IP_CT_NEW || ctinfo == IP_CT_RELATED));
161
162         if (hooknum == NF_IP_LOCAL_OUT
163             && mr->range[0].flags & IP_NAT_RANGE_MAP_IPS)
164                 warn_if_extra_mangle((*pskb)->nh.iph->daddr,
165                                      mr->range[0].min_ip);
166
167         return ip_nat_setup_info(ct, &mr->range[0], hooknum);
168 }
169
170 static int ipt_snat_checkentry(const char *tablename,
171                                const struct ipt_entry *e,
172                                void *targinfo,
173                                unsigned int targinfosize,
174                                unsigned int hook_mask)
175 {
176         struct ip_nat_multi_range_compat *mr = targinfo;
177
178         /* Must be a valid range */
179         if (mr->rangesize != 1) {
180                 printk("SNAT: multiple ranges no longer supported\n");
181                 return 0;
182         }
183
184         if (targinfosize != IPT_ALIGN(sizeof(struct ip_nat_multi_range_compat))) {
185                 DEBUGP("SNAT: Target size %u wrong for %u ranges\n",
186                        targinfosize, mr->rangesize);
187                 return 0;
188         }
189
190         /* Only allow these for NAT. */
191         if (strcmp(tablename, "nat") != 0) {
192                 DEBUGP("SNAT: wrong table %s\n", tablename);
193                 return 0;
194         }
195
196         if (hook_mask & ~(1 << NF_IP_POST_ROUTING)) {
197                 DEBUGP("SNAT: hook mask 0x%x bad\n", hook_mask);
198                 return 0;
199         }
200         return 1;
201 }
202
203 static int ipt_dnat_checkentry(const char *tablename,
204                                const struct ipt_entry *e,
205                                void *targinfo,
206                                unsigned int targinfosize,
207                                unsigned int hook_mask)
208 {
209         struct ip_nat_multi_range_compat *mr = targinfo;
210
211         /* Must be a valid range */
212         if (mr->rangesize != 1) {
213                 printk("DNAT: multiple ranges no longer supported\n");
214                 return 0;
215         }
216
217         if (targinfosize != IPT_ALIGN(sizeof(struct ip_nat_multi_range_compat))) {
218                 DEBUGP("DNAT: Target size %u wrong for %u ranges\n",
219                        targinfosize, mr->rangesize);
220                 return 0;
221         }
222
223         /* Only allow these for NAT. */
224         if (strcmp(tablename, "nat") != 0) {
225                 DEBUGP("DNAT: wrong table %s\n", tablename);
226                 return 0;
227         }
228
229         if (hook_mask & ~((1 << NF_IP_PRE_ROUTING) | (1 << NF_IP_LOCAL_OUT))) {
230                 DEBUGP("DNAT: hook mask 0x%x bad\n", hook_mask);
231                 return 0;
232         }
233         
234         return 1;
235 }
236
237 inline unsigned int
238 alloc_null_binding(struct ip_conntrack *conntrack,
239                    struct ip_nat_info *info,
240                    unsigned int hooknum)
241 {
242         /* Force range to this IP; let proto decide mapping for
243            per-proto parts (hence not IP_NAT_RANGE_PROTO_SPECIFIED).
244            Use reply in case it's already been mangled (eg local packet).
245         */
246         u_int32_t ip
247                 = (HOOK2MANIP(hooknum) == IP_NAT_MANIP_SRC
248                    ? conntrack->tuplehash[IP_CT_DIR_REPLY].tuple.dst.ip
249                    : conntrack->tuplehash[IP_CT_DIR_REPLY].tuple.src.ip);
250         struct ip_nat_range range
251                 = { IP_NAT_RANGE_MAP_IPS, ip, ip, { 0 }, { 0 } };
252
253         DEBUGP("Allocating NULL binding for %p (%u.%u.%u.%u)\n", conntrack,
254                NIPQUAD(ip));
255         return ip_nat_setup_info(conntrack, &range, hooknum);
256 }
257
258 unsigned int
259 alloc_null_binding_confirmed(struct ip_conntrack *conntrack,
260                              struct ip_nat_info *info,
261                              unsigned int hooknum)
262 {
263         u_int32_t ip
264                 = (HOOK2MANIP(hooknum) == IP_NAT_MANIP_SRC
265                    ? conntrack->tuplehash[IP_CT_DIR_REPLY].tuple.dst.ip
266                    : conntrack->tuplehash[IP_CT_DIR_REPLY].tuple.src.ip);
267         u_int16_t all
268                 = (HOOK2MANIP(hooknum) == IP_NAT_MANIP_SRC
269                    ? conntrack->tuplehash[IP_CT_DIR_REPLY].tuple.dst.u.all
270                    : conntrack->tuplehash[IP_CT_DIR_REPLY].tuple.src.u.all);
271         struct ip_nat_range range
272                 = { IP_NAT_RANGE_MAP_IPS, ip, ip, { all }, { all } };
273
274         DEBUGP("Allocating NULL binding for confirmed %p (%u.%u.%u.%u)\n",
275                conntrack, NIPQUAD(ip));
276         return ip_nat_setup_info(conntrack, &range, hooknum);
277 }
278
279 int ip_nat_rule_find(struct sk_buff **pskb,
280                      unsigned int hooknum,
281                      const struct net_device *in,
282                      const struct net_device *out,
283                      struct ip_conntrack *ct,
284                      struct ip_nat_info *info)
285 {
286         int ret;
287
288         ret = ipt_do_table(pskb, hooknum, in, out, &nat_table, NULL);
289
290         if (ret == NF_ACCEPT) {
291                 if (!ip_nat_initialized(ct, HOOK2MANIP(hooknum)))
292                         /* NUL mapping */
293                         ret = alloc_null_binding(ct, info, hooknum);
294         }
295         return ret;
296 }
297
298 static struct ipt_target ipt_snat_reg = {
299         .name           = "SNAT",
300         .target         = ipt_snat_target,
301         .checkentry     = ipt_snat_checkentry,
302 };
303
304 static struct ipt_target ipt_dnat_reg = {
305         .name           = "DNAT",
306         .target         = ipt_dnat_target,
307         .checkentry     = ipt_dnat_checkentry,
308 };
309
310 int __init ip_nat_rule_init(void)
311 {
312         int ret;
313
314         ret = ipt_register_table(&nat_table, &nat_initial_table.repl);
315         if (ret != 0)
316                 return ret;
317         ret = ipt_register_target(&ipt_snat_reg);
318         if (ret != 0)
319                 goto unregister_table;
320
321         ret = ipt_register_target(&ipt_dnat_reg);
322         if (ret != 0)
323                 goto unregister_snat;
324
325         return ret;
326
327  unregister_snat:
328         ipt_unregister_target(&ipt_snat_reg);
329  unregister_table:
330         ipt_unregister_table(&nat_table);
331
332         return ret;
333 }
334
335 void ip_nat_rule_cleanup(void)
336 {
337         ipt_unregister_target(&ipt_dnat_reg);
338         ipt_unregister_target(&ipt_snat_reg);
339         ipt_unregister_table(&nat_table);
340 }