module: add MODULE_STATE_GOING notifier call
[linux-2.6.git] / kernel / module.c
1 /*
2    Copyright (C) 2002 Richard Henderson
3    Copyright (C) 2001 Rusty Russell, 2002 Rusty Russell IBM.
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 */
19 #include <linux/module.h>
20 #include <linux/moduleloader.h>
21 #include <linux/init.h>
22 #include <linux/kallsyms.h>
23 #include <linux/sysfs.h>
24 #include <linux/kernel.h>
25 #include <linux/slab.h>
26 #include <linux/vmalloc.h>
27 #include <linux/elf.h>
28 #include <linux/seq_file.h>
29 #include <linux/syscalls.h>
30 #include <linux/fcntl.h>
31 #include <linux/rcupdate.h>
32 #include <linux/capability.h>
33 #include <linux/cpu.h>
34 #include <linux/moduleparam.h>
35 #include <linux/errno.h>
36 #include <linux/err.h>
37 #include <linux/vermagic.h>
38 #include <linux/notifier.h>
39 #include <linux/sched.h>
40 #include <linux/stop_machine.h>
41 #include <linux/device.h>
42 #include <linux/string.h>
43 #include <linux/mutex.h>
44 #include <linux/unwind.h>
45 #include <asm/uaccess.h>
46 #include <asm/cacheflush.h>
47 #include <linux/license.h>
48 #include <asm/sections.h>
49
50 #if 0
51 #define DEBUGP printk
52 #else
53 #define DEBUGP(fmt , a...)
54 #endif
55
56 #ifndef ARCH_SHF_SMALL
57 #define ARCH_SHF_SMALL 0
58 #endif
59
60 /* If this is set, the section belongs in the init part of the module */
61 #define INIT_OFFSET_MASK (1UL << (BITS_PER_LONG-1))
62
63 /* List of modules, protected by module_mutex or preempt_disable
64  * (add/delete uses stop_machine). */
65 static DEFINE_MUTEX(module_mutex);
66 static LIST_HEAD(modules);
67
68 /* Waiting for a module to finish initializing? */
69 static DECLARE_WAIT_QUEUE_HEAD(module_wq);
70
71 static BLOCKING_NOTIFIER_HEAD(module_notify_list);
72
73 int register_module_notifier(struct notifier_block * nb)
74 {
75         return blocking_notifier_chain_register(&module_notify_list, nb);
76 }
77 EXPORT_SYMBOL(register_module_notifier);
78
79 int unregister_module_notifier(struct notifier_block * nb)
80 {
81         return blocking_notifier_chain_unregister(&module_notify_list, nb);
82 }
83 EXPORT_SYMBOL(unregister_module_notifier);
84
85 /* We require a truly strong try_module_get(): 0 means failure due to
86    ongoing or failed initialization etc. */
87 static inline int strong_try_module_get(struct module *mod)
88 {
89         if (mod && mod->state == MODULE_STATE_COMING)
90                 return -EBUSY;
91         if (try_module_get(mod))
92                 return 0;
93         else
94                 return -ENOENT;
95 }
96
97 static inline void add_taint_module(struct module *mod, unsigned flag)
98 {
99         add_taint(flag);
100         mod->taints |= flag;
101 }
102
103 /*
104  * A thread that wants to hold a reference to a module only while it
105  * is running can call this to safely exit.  nfsd and lockd use this.
106  */
107 void __module_put_and_exit(struct module *mod, long code)
108 {
109         module_put(mod);
110         do_exit(code);
111 }
112 EXPORT_SYMBOL(__module_put_and_exit);
113
114 /* Find a module section: 0 means not found. */
115 static unsigned int find_sec(Elf_Ehdr *hdr,
116                              Elf_Shdr *sechdrs,
117                              const char *secstrings,
118                              const char *name)
119 {
120         unsigned int i;
121
122         for (i = 1; i < hdr->e_shnum; i++)
123                 /* Alloc bit cleared means "ignore it." */
124                 if ((sechdrs[i].sh_flags & SHF_ALLOC)
125                     && strcmp(secstrings+sechdrs[i].sh_name, name) == 0)
126                         return i;
127         return 0;
128 }
129
130 /* Provided by the linker */
131 extern const struct kernel_symbol __start___ksymtab[];
132 extern const struct kernel_symbol __stop___ksymtab[];
133 extern const struct kernel_symbol __start___ksymtab_gpl[];
134 extern const struct kernel_symbol __stop___ksymtab_gpl[];
135 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
136 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
137 extern const struct kernel_symbol __start___ksymtab_unused[];
138 extern const struct kernel_symbol __stop___ksymtab_unused[];
139 extern const struct kernel_symbol __start___ksymtab_unused_gpl[];
140 extern const struct kernel_symbol __stop___ksymtab_unused_gpl[];
141 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
142 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
143 extern const unsigned long __start___kcrctab[];
144 extern const unsigned long __start___kcrctab_gpl[];
145 extern const unsigned long __start___kcrctab_gpl_future[];
146 extern const unsigned long __start___kcrctab_unused[];
147 extern const unsigned long __start___kcrctab_unused_gpl[];
148
149 #ifndef CONFIG_MODVERSIONS
150 #define symversion(base, idx) NULL
151 #else
152 #define symversion(base, idx) ((base != NULL) ? ((base) + (idx)) : NULL)
153 #endif
154
155 /* lookup symbol in given range of kernel_symbols */
156 static const struct kernel_symbol *lookup_symbol(const char *name,
157         const struct kernel_symbol *start,
158         const struct kernel_symbol *stop)
159 {
160         const struct kernel_symbol *ks = start;
161         for (; ks < stop; ks++)
162                 if (strcmp(ks->name, name) == 0)
163                         return ks;
164         return NULL;
165 }
166
167 static bool always_ok(bool gplok, bool warn, const char *name)
168 {
169         return true;
170 }
171
172 static bool printk_unused_warning(bool gplok, bool warn, const char *name)
173 {
174         if (warn) {
175                 printk(KERN_WARNING "Symbol %s is marked as UNUSED, "
176                        "however this module is using it.\n", name);
177                 printk(KERN_WARNING
178                        "This symbol will go away in the future.\n");
179                 printk(KERN_WARNING
180                        "Please evalute if this is the right api to use and if "
181                        "it really is, submit a report the linux kernel "
182                        "mailinglist together with submitting your code for "
183                        "inclusion.\n");
184         }
185         return true;
186 }
187
188 static bool gpl_only_unused_warning(bool gplok, bool warn, const char *name)
189 {
190         if (!gplok)
191                 return false;
192         return printk_unused_warning(gplok, warn, name);
193 }
194
195 static bool gpl_only(bool gplok, bool warn, const char *name)
196 {
197         return gplok;
198 }
199
200 static bool warn_if_not_gpl(bool gplok, bool warn, const char *name)
201 {
202         if (!gplok && warn) {
203                 printk(KERN_WARNING "Symbol %s is being used "
204                        "by a non-GPL module, which will not "
205                        "be allowed in the future\n", name);
206                 printk(KERN_WARNING "Please see the file "
207                        "Documentation/feature-removal-schedule.txt "
208                        "in the kernel source tree for more details.\n");
209         }
210         return true;
211 }
212
213 struct symsearch {
214         const struct kernel_symbol *start, *stop;
215         const unsigned long *crcs;
216         bool (*check)(bool gplok, bool warn, const char *name);
217 };
218
219 /* Look through this array of symbol tables for a symbol match which
220  * passes the check function. */
221 static const struct kernel_symbol *search_symarrays(const struct symsearch *arr,
222                                                     unsigned int num,
223                                                     const char *name,
224                                                     bool gplok,
225                                                     bool warn,
226                                                     const unsigned long **crc)
227 {
228         unsigned int i;
229         const struct kernel_symbol *ks;
230
231         for (i = 0; i < num; i++) {
232                 ks = lookup_symbol(name, arr[i].start, arr[i].stop);
233                 if (!ks || !arr[i].check(gplok, warn, name))
234                         continue;
235
236                 if (crc)
237                         *crc = symversion(arr[i].crcs, ks - arr[i].start);
238                 return ks;
239         }
240         return NULL;
241 }
242
243 /* Find a symbol, return value, (optional) crc and (optional) module
244  * which owns it */
245 static unsigned long find_symbol(const char *name,
246                                  struct module **owner,
247                                  const unsigned long **crc,
248                                  bool gplok,
249                                  bool warn)
250 {
251         struct module *mod;
252         const struct kernel_symbol *ks;
253         const struct symsearch arr[] = {
254                 { __start___ksymtab, __stop___ksymtab, __start___kcrctab,
255                   always_ok },
256                 { __start___ksymtab_gpl, __stop___ksymtab_gpl,
257                   __start___kcrctab_gpl, gpl_only },
258                 { __start___ksymtab_gpl_future, __stop___ksymtab_gpl_future,
259                   __start___kcrctab_gpl_future, warn_if_not_gpl },
260                 { __start___ksymtab_unused, __stop___ksymtab_unused,
261                   __start___kcrctab_unused, printk_unused_warning },
262                 { __start___ksymtab_unused_gpl, __stop___ksymtab_unused_gpl,
263                   __start___kcrctab_unused_gpl, gpl_only_unused_warning },
264         };
265
266         /* Core kernel first. */
267         ks = search_symarrays(arr, ARRAY_SIZE(arr), name, gplok, warn, crc);
268         if (ks) {
269                 if (owner)
270                         *owner = NULL;
271                 return ks->value;
272         }
273
274         /* Now try modules. */
275         list_for_each_entry(mod, &modules, list) {
276                 struct symsearch arr[] = {
277                         { mod->syms, mod->syms + mod->num_syms, mod->crcs,
278                           always_ok },
279                         { mod->gpl_syms, mod->gpl_syms + mod->num_gpl_syms,
280                           mod->gpl_crcs, gpl_only },
281                         { mod->gpl_future_syms,
282                           mod->gpl_future_syms + mod->num_gpl_future_syms,
283                           mod->gpl_future_crcs, warn_if_not_gpl },
284                         { mod->unused_syms,
285                           mod->unused_syms + mod->num_unused_syms,
286                           mod->unused_crcs, printk_unused_warning },
287                         { mod->unused_gpl_syms,
288                           mod->unused_gpl_syms + mod->num_unused_gpl_syms,
289                           mod->unused_gpl_crcs, gpl_only_unused_warning },
290                 };
291
292                 ks = search_symarrays(arr, ARRAY_SIZE(arr),
293                                       name, gplok, warn, crc);
294                 if (ks) {
295                         if (owner)
296                                 *owner = mod;
297                         return ks->value;
298                 }
299         }
300
301         DEBUGP("Failed to find symbol %s\n", name);
302         return -ENOENT;
303 }
304
305 /* Search for module by name: must hold module_mutex. */
306 static struct module *find_module(const char *name)
307 {
308         struct module *mod;
309
310         list_for_each_entry(mod, &modules, list) {
311                 if (strcmp(mod->name, name) == 0)
312                         return mod;
313         }
314         return NULL;
315 }
316
317 #ifdef CONFIG_SMP
318 /* Number of blocks used and allocated. */
319 static unsigned int pcpu_num_used, pcpu_num_allocated;
320 /* Size of each block.  -ve means used. */
321 static int *pcpu_size;
322
323 static int split_block(unsigned int i, unsigned short size)
324 {
325         /* Reallocation required? */
326         if (pcpu_num_used + 1 > pcpu_num_allocated) {
327                 int *new;
328
329                 new = krealloc(pcpu_size, sizeof(new[0])*pcpu_num_allocated*2,
330                                GFP_KERNEL);
331                 if (!new)
332                         return 0;
333
334                 pcpu_num_allocated *= 2;
335                 pcpu_size = new;
336         }
337
338         /* Insert a new subblock */
339         memmove(&pcpu_size[i+1], &pcpu_size[i],
340                 sizeof(pcpu_size[0]) * (pcpu_num_used - i));
341         pcpu_num_used++;
342
343         pcpu_size[i+1] -= size;
344         pcpu_size[i] = size;
345         return 1;
346 }
347
348 static inline unsigned int block_size(int val)
349 {
350         if (val < 0)
351                 return -val;
352         return val;
353 }
354
355 static void *percpu_modalloc(unsigned long size, unsigned long align,
356                              const char *name)
357 {
358         unsigned long extra;
359         unsigned int i;
360         void *ptr;
361
362         if (align > PAGE_SIZE) {
363                 printk(KERN_WARNING "%s: per-cpu alignment %li > %li\n",
364                        name, align, PAGE_SIZE);
365                 align = PAGE_SIZE;
366         }
367
368         ptr = __per_cpu_start;
369         for (i = 0; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
370                 /* Extra for alignment requirement. */
371                 extra = ALIGN((unsigned long)ptr, align) - (unsigned long)ptr;
372                 BUG_ON(i == 0 && extra != 0);
373
374                 if (pcpu_size[i] < 0 || pcpu_size[i] < extra + size)
375                         continue;
376
377                 /* Transfer extra to previous block. */
378                 if (pcpu_size[i-1] < 0)
379                         pcpu_size[i-1] -= extra;
380                 else
381                         pcpu_size[i-1] += extra;
382                 pcpu_size[i] -= extra;
383                 ptr += extra;
384
385                 /* Split block if warranted */
386                 if (pcpu_size[i] - size > sizeof(unsigned long))
387                         if (!split_block(i, size))
388                                 return NULL;
389
390                 /* Mark allocated */
391                 pcpu_size[i] = -pcpu_size[i];
392                 return ptr;
393         }
394
395         printk(KERN_WARNING "Could not allocate %lu bytes percpu data\n",
396                size);
397         return NULL;
398 }
399
400 static void percpu_modfree(void *freeme)
401 {
402         unsigned int i;
403         void *ptr = __per_cpu_start + block_size(pcpu_size[0]);
404
405         /* First entry is core kernel percpu data. */
406         for (i = 1; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
407                 if (ptr == freeme) {
408                         pcpu_size[i] = -pcpu_size[i];
409                         goto free;
410                 }
411         }
412         BUG();
413
414  free:
415         /* Merge with previous? */
416         if (pcpu_size[i-1] >= 0) {
417                 pcpu_size[i-1] += pcpu_size[i];
418                 pcpu_num_used--;
419                 memmove(&pcpu_size[i], &pcpu_size[i+1],
420                         (pcpu_num_used - i) * sizeof(pcpu_size[0]));
421                 i--;
422         }
423         /* Merge with next? */
424         if (i+1 < pcpu_num_used && pcpu_size[i+1] >= 0) {
425                 pcpu_size[i] += pcpu_size[i+1];
426                 pcpu_num_used--;
427                 memmove(&pcpu_size[i+1], &pcpu_size[i+2],
428                         (pcpu_num_used - (i+1)) * sizeof(pcpu_size[0]));
429         }
430 }
431
432 static unsigned int find_pcpusec(Elf_Ehdr *hdr,
433                                  Elf_Shdr *sechdrs,
434                                  const char *secstrings)
435 {
436         return find_sec(hdr, sechdrs, secstrings, ".data.percpu");
437 }
438
439 static void percpu_modcopy(void *pcpudest, const void *from, unsigned long size)
440 {
441         int cpu;
442
443         for_each_possible_cpu(cpu)
444                 memcpy(pcpudest + per_cpu_offset(cpu), from, size);
445 }
446
447 static int percpu_modinit(void)
448 {
449         pcpu_num_used = 2;
450         pcpu_num_allocated = 2;
451         pcpu_size = kmalloc(sizeof(pcpu_size[0]) * pcpu_num_allocated,
452                             GFP_KERNEL);
453         /* Static in-kernel percpu data (used). */
454         pcpu_size[0] = -(__per_cpu_end-__per_cpu_start);
455         /* Free room. */
456         pcpu_size[1] = PERCPU_ENOUGH_ROOM + pcpu_size[0];
457         if (pcpu_size[1] < 0) {
458                 printk(KERN_ERR "No per-cpu room for modules.\n");
459                 pcpu_num_used = 1;
460         }
461
462         return 0;
463 }
464 __initcall(percpu_modinit);
465 #else /* ... !CONFIG_SMP */
466 static inline void *percpu_modalloc(unsigned long size, unsigned long align,
467                                     const char *name)
468 {
469         return NULL;
470 }
471 static inline void percpu_modfree(void *pcpuptr)
472 {
473         BUG();
474 }
475 static inline unsigned int find_pcpusec(Elf_Ehdr *hdr,
476                                         Elf_Shdr *sechdrs,
477                                         const char *secstrings)
478 {
479         return 0;
480 }
481 static inline void percpu_modcopy(void *pcpudst, const void *src,
482                                   unsigned long size)
483 {
484         /* pcpusec should be 0, and size of that section should be 0. */
485         BUG_ON(size != 0);
486 }
487 #endif /* CONFIG_SMP */
488
489 #define MODINFO_ATTR(field)     \
490 static void setup_modinfo_##field(struct module *mod, const char *s)  \
491 {                                                                     \
492         mod->field = kstrdup(s, GFP_KERNEL);                          \
493 }                                                                     \
494 static ssize_t show_modinfo_##field(struct module_attribute *mattr,   \
495                         struct module *mod, char *buffer)             \
496 {                                                                     \
497         return sprintf(buffer, "%s\n", mod->field);                   \
498 }                                                                     \
499 static int modinfo_##field##_exists(struct module *mod)               \
500 {                                                                     \
501         return mod->field != NULL;                                    \
502 }                                                                     \
503 static void free_modinfo_##field(struct module *mod)                  \
504 {                                                                     \
505         kfree(mod->field);                                            \
506         mod->field = NULL;                                            \
507 }                                                                     \
508 static struct module_attribute modinfo_##field = {                    \
509         .attr = { .name = __stringify(field), .mode = 0444 },         \
510         .show = show_modinfo_##field,                                 \
511         .setup = setup_modinfo_##field,                               \
512         .test = modinfo_##field##_exists,                             \
513         .free = free_modinfo_##field,                                 \
514 };
515
516 MODINFO_ATTR(version);
517 MODINFO_ATTR(srcversion);
518
519 static char last_unloaded_module[MODULE_NAME_LEN+1];
520
521 #ifdef CONFIG_MODULE_UNLOAD
522 /* Init the unload section of the module. */
523 static void module_unload_init(struct module *mod)
524 {
525         unsigned int i;
526
527         INIT_LIST_HEAD(&mod->modules_which_use_me);
528         for (i = 0; i < NR_CPUS; i++)
529                 local_set(&mod->ref[i].count, 0);
530         /* Hold reference count during initialization. */
531         local_set(&mod->ref[raw_smp_processor_id()].count, 1);
532         /* Backwards compatibility macros put refcount during init. */
533         mod->waiter = current;
534 }
535
536 /* modules using other modules */
537 struct module_use
538 {
539         struct list_head list;
540         struct module *module_which_uses;
541 };
542
543 /* Does a already use b? */
544 static int already_uses(struct module *a, struct module *b)
545 {
546         struct module_use *use;
547
548         list_for_each_entry(use, &b->modules_which_use_me, list) {
549                 if (use->module_which_uses == a) {
550                         DEBUGP("%s uses %s!\n", a->name, b->name);
551                         return 1;
552                 }
553         }
554         DEBUGP("%s does not use %s!\n", a->name, b->name);
555         return 0;
556 }
557
558 /* Module a uses b */
559 static int use_module(struct module *a, struct module *b)
560 {
561         struct module_use *use;
562         int no_warn, err;
563
564         if (b == NULL || already_uses(a, b)) return 1;
565
566         /* If we're interrupted or time out, we fail. */
567         if (wait_event_interruptible_timeout(
568                     module_wq, (err = strong_try_module_get(b)) != -EBUSY,
569                     30 * HZ) <= 0) {
570                 printk("%s: gave up waiting for init of module %s.\n",
571                        a->name, b->name);
572                 return 0;
573         }
574
575         /* If strong_try_module_get() returned a different error, we fail. */
576         if (err)
577                 return 0;
578
579         DEBUGP("Allocating new usage for %s.\n", a->name);
580         use = kmalloc(sizeof(*use), GFP_ATOMIC);
581         if (!use) {
582                 printk("%s: out of memory loading\n", a->name);
583                 module_put(b);
584                 return 0;
585         }
586
587         use->module_which_uses = a;
588         list_add(&use->list, &b->modules_which_use_me);
589         no_warn = sysfs_create_link(b->holders_dir, &a->mkobj.kobj, a->name);
590         return 1;
591 }
592
593 /* Clear the unload stuff of the module. */
594 static void module_unload_free(struct module *mod)
595 {
596         struct module *i;
597
598         list_for_each_entry(i, &modules, list) {
599                 struct module_use *use;
600
601                 list_for_each_entry(use, &i->modules_which_use_me, list) {
602                         if (use->module_which_uses == mod) {
603                                 DEBUGP("%s unusing %s\n", mod->name, i->name);
604                                 module_put(i);
605                                 list_del(&use->list);
606                                 kfree(use);
607                                 sysfs_remove_link(i->holders_dir, mod->name);
608                                 /* There can be at most one match. */
609                                 break;
610                         }
611                 }
612         }
613 }
614
615 #ifdef CONFIG_MODULE_FORCE_UNLOAD
616 static inline int try_force_unload(unsigned int flags)
617 {
618         int ret = (flags & O_TRUNC);
619         if (ret)
620                 add_taint(TAINT_FORCED_RMMOD);
621         return ret;
622 }
623 #else
624 static inline int try_force_unload(unsigned int flags)
625 {
626         return 0;
627 }
628 #endif /* CONFIG_MODULE_FORCE_UNLOAD */
629
630 struct stopref
631 {
632         struct module *mod;
633         int flags;
634         int *forced;
635 };
636
637 /* Whole machine is stopped with interrupts off when this runs. */
638 static int __try_stop_module(void *_sref)
639 {
640         struct stopref *sref = _sref;
641
642         /* If it's not unused, quit unless we are told to block. */
643         if ((sref->flags & O_NONBLOCK) && module_refcount(sref->mod) != 0) {
644                 if (!(*sref->forced = try_force_unload(sref->flags)))
645                         return -EWOULDBLOCK;
646         }
647
648         /* Mark it as dying. */
649         sref->mod->state = MODULE_STATE_GOING;
650         return 0;
651 }
652
653 static int try_stop_module(struct module *mod, int flags, int *forced)
654 {
655         struct stopref sref = { mod, flags, forced };
656
657         return stop_machine_run(__try_stop_module, &sref, NR_CPUS);
658 }
659
660 unsigned int module_refcount(struct module *mod)
661 {
662         unsigned int i, total = 0;
663
664         for (i = 0; i < NR_CPUS; i++)
665                 total += local_read(&mod->ref[i].count);
666         return total;
667 }
668 EXPORT_SYMBOL(module_refcount);
669
670 /* This exists whether we can unload or not */
671 static void free_module(struct module *mod);
672
673 static void wait_for_zero_refcount(struct module *mod)
674 {
675         /* Since we might sleep for some time, release the mutex first */
676         mutex_unlock(&module_mutex);
677         for (;;) {
678                 DEBUGP("Looking at refcount...\n");
679                 set_current_state(TASK_UNINTERRUPTIBLE);
680                 if (module_refcount(mod) == 0)
681                         break;
682                 schedule();
683         }
684         current->state = TASK_RUNNING;
685         mutex_lock(&module_mutex);
686 }
687
688 asmlinkage long
689 sys_delete_module(const char __user *name_user, unsigned int flags)
690 {
691         struct module *mod;
692         char name[MODULE_NAME_LEN];
693         int ret, forced = 0;
694
695         if (!capable(CAP_SYS_MODULE))
696                 return -EPERM;
697
698         if (strncpy_from_user(name, name_user, MODULE_NAME_LEN-1) < 0)
699                 return -EFAULT;
700         name[MODULE_NAME_LEN-1] = '\0';
701
702         if (mutex_lock_interruptible(&module_mutex) != 0)
703                 return -EINTR;
704
705         mod = find_module(name);
706         if (!mod) {
707                 ret = -ENOENT;
708                 goto out;
709         }
710
711         if (!list_empty(&mod->modules_which_use_me)) {
712                 /* Other modules depend on us: get rid of them first. */
713                 ret = -EWOULDBLOCK;
714                 goto out;
715         }
716
717         /* Doing init or already dying? */
718         if (mod->state != MODULE_STATE_LIVE) {
719                 /* FIXME: if (force), slam module count and wake up
720                    waiter --RR */
721                 DEBUGP("%s already dying\n", mod->name);
722                 ret = -EBUSY;
723                 goto out;
724         }
725
726         /* If it has an init func, it must have an exit func to unload */
727         if (mod->init && !mod->exit) {
728                 forced = try_force_unload(flags);
729                 if (!forced) {
730                         /* This module can't be removed */
731                         ret = -EBUSY;
732                         goto out;
733                 }
734         }
735
736         /* Set this up before setting mod->state */
737         mod->waiter = current;
738
739         /* Stop the machine so refcounts can't move and disable module. */
740         ret = try_stop_module(mod, flags, &forced);
741         if (ret != 0)
742                 goto out;
743
744         /* Never wait if forced. */
745         if (!forced && module_refcount(mod) != 0)
746                 wait_for_zero_refcount(mod);
747
748         mutex_unlock(&module_mutex);
749         /* Final destruction now noone is using it. */
750         if (mod->exit != NULL)
751                 mod->exit();
752         blocking_notifier_call_chain(&module_notify_list,
753                                      MODULE_STATE_GOING, mod);
754         mutex_lock(&module_mutex);
755         /* Store the name of the last unloaded module for diagnostic purposes */
756         strlcpy(last_unloaded_module, mod->name, sizeof(last_unloaded_module));
757         free_module(mod);
758
759  out:
760         mutex_unlock(&module_mutex);
761         return ret;
762 }
763
764 static void print_unload_info(struct seq_file *m, struct module *mod)
765 {
766         struct module_use *use;
767         int printed_something = 0;
768
769         seq_printf(m, " %u ", module_refcount(mod));
770
771         /* Always include a trailing , so userspace can differentiate
772            between this and the old multi-field proc format. */
773         list_for_each_entry(use, &mod->modules_which_use_me, list) {
774                 printed_something = 1;
775                 seq_printf(m, "%s,", use->module_which_uses->name);
776         }
777
778         if (mod->init != NULL && mod->exit == NULL) {
779                 printed_something = 1;
780                 seq_printf(m, "[permanent],");
781         }
782
783         if (!printed_something)
784                 seq_printf(m, "-");
785 }
786
787 void __symbol_put(const char *symbol)
788 {
789         struct module *owner;
790
791         preempt_disable();
792         if (IS_ERR_VALUE(find_symbol(symbol, &owner, NULL, true, false)))
793                 BUG();
794         module_put(owner);
795         preempt_enable();
796 }
797 EXPORT_SYMBOL(__symbol_put);
798
799 void symbol_put_addr(void *addr)
800 {
801         struct module *modaddr;
802
803         if (core_kernel_text((unsigned long)addr))
804                 return;
805
806         if (!(modaddr = module_text_address((unsigned long)addr)))
807                 BUG();
808         module_put(modaddr);
809 }
810 EXPORT_SYMBOL_GPL(symbol_put_addr);
811
812 static ssize_t show_refcnt(struct module_attribute *mattr,
813                            struct module *mod, char *buffer)
814 {
815         return sprintf(buffer, "%u\n", module_refcount(mod));
816 }
817
818 static struct module_attribute refcnt = {
819         .attr = { .name = "refcnt", .mode = 0444 },
820         .show = show_refcnt,
821 };
822
823 void module_put(struct module *module)
824 {
825         if (module) {
826                 unsigned int cpu = get_cpu();
827                 local_dec(&module->ref[cpu].count);
828                 /* Maybe they're waiting for us to drop reference? */
829                 if (unlikely(!module_is_live(module)))
830                         wake_up_process(module->waiter);
831                 put_cpu();
832         }
833 }
834 EXPORT_SYMBOL(module_put);
835
836 #else /* !CONFIG_MODULE_UNLOAD */
837 static void print_unload_info(struct seq_file *m, struct module *mod)
838 {
839         /* We don't know the usage count, or what modules are using. */
840         seq_printf(m, " - -");
841 }
842
843 static inline void module_unload_free(struct module *mod)
844 {
845 }
846
847 static inline int use_module(struct module *a, struct module *b)
848 {
849         return strong_try_module_get(b) == 0;
850 }
851
852 static inline void module_unload_init(struct module *mod)
853 {
854 }
855 #endif /* CONFIG_MODULE_UNLOAD */
856
857 static ssize_t show_initstate(struct module_attribute *mattr,
858                            struct module *mod, char *buffer)
859 {
860         const char *state = "unknown";
861
862         switch (mod->state) {
863         case MODULE_STATE_LIVE:
864                 state = "live";
865                 break;
866         case MODULE_STATE_COMING:
867                 state = "coming";
868                 break;
869         case MODULE_STATE_GOING:
870                 state = "going";
871                 break;
872         }
873         return sprintf(buffer, "%s\n", state);
874 }
875
876 static struct module_attribute initstate = {
877         .attr = { .name = "initstate", .mode = 0444 },
878         .show = show_initstate,
879 };
880
881 static struct module_attribute *modinfo_attrs[] = {
882         &modinfo_version,
883         &modinfo_srcversion,
884         &initstate,
885 #ifdef CONFIG_MODULE_UNLOAD
886         &refcnt,
887 #endif
888         NULL,
889 };
890
891 static const char vermagic[] = VERMAGIC_STRING;
892
893 #ifdef CONFIG_MODVERSIONS
894 static int check_version(Elf_Shdr *sechdrs,
895                          unsigned int versindex,
896                          const char *symname,
897                          struct module *mod, 
898                          const unsigned long *crc)
899 {
900         unsigned int i, num_versions;
901         struct modversion_info *versions;
902
903         /* Exporting module didn't supply crcs?  OK, we're already tainted. */
904         if (!crc)
905                 return 1;
906
907         versions = (void *) sechdrs[versindex].sh_addr;
908         num_versions = sechdrs[versindex].sh_size
909                 / sizeof(struct modversion_info);
910
911         for (i = 0; i < num_versions; i++) {
912                 if (strcmp(versions[i].name, symname) != 0)
913                         continue;
914
915                 if (versions[i].crc == *crc)
916                         return 1;
917                 printk("%s: disagrees about version of symbol %s\n",
918                        mod->name, symname);
919                 DEBUGP("Found checksum %lX vs module %lX\n",
920                        *crc, versions[i].crc);
921                 return 0;
922         }
923         /* Not in module's version table.  OK, but that taints the kernel. */
924         if (!(tainted & TAINT_FORCED_MODULE))
925                 printk("%s: no version for \"%s\" found: kernel tainted.\n",
926                        mod->name, symname);
927         add_taint_module(mod, TAINT_FORCED_MODULE);
928         return 1;
929 }
930
931 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
932                                           unsigned int versindex,
933                                           struct module *mod)
934 {
935         const unsigned long *crc;
936
937         if (IS_ERR_VALUE(find_symbol("struct_module", NULL, &crc, true, false)))
938                 BUG();
939         return check_version(sechdrs, versindex, "struct_module", mod, crc);
940 }
941
942 /* First part is kernel version, which we ignore. */
943 static inline int same_magic(const char *amagic, const char *bmagic)
944 {
945         amagic += strcspn(amagic, " ");
946         bmagic += strcspn(bmagic, " ");
947         return strcmp(amagic, bmagic) == 0;
948 }
949 #else
950 static inline int check_version(Elf_Shdr *sechdrs,
951                                 unsigned int versindex,
952                                 const char *symname,
953                                 struct module *mod, 
954                                 const unsigned long *crc)
955 {
956         return 1;
957 }
958
959 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
960                                           unsigned int versindex,
961                                           struct module *mod)
962 {
963         return 1;
964 }
965
966 static inline int same_magic(const char *amagic, const char *bmagic)
967 {
968         return strcmp(amagic, bmagic) == 0;
969 }
970 #endif /* CONFIG_MODVERSIONS */
971
972 /* Resolve a symbol for this module.  I.e. if we find one, record usage.
973    Must be holding module_mutex. */
974 static unsigned long resolve_symbol(Elf_Shdr *sechdrs,
975                                     unsigned int versindex,
976                                     const char *name,
977                                     struct module *mod)
978 {
979         struct module *owner;
980         unsigned long ret;
981         const unsigned long *crc;
982
983         ret = find_symbol(name, &owner, &crc,
984                           !(mod->taints & TAINT_PROPRIETARY_MODULE), true);
985         if (!IS_ERR_VALUE(ret)) {
986                 /* use_module can fail due to OOM,
987                    or module initialization or unloading */
988                 if (!check_version(sechdrs, versindex, name, mod, crc) ||
989                     !use_module(mod, owner))
990                         ret = -EINVAL;
991         }
992         return ret;
993 }
994
995 /*
996  * /sys/module/foo/sections stuff
997  * J. Corbet <corbet@lwn.net>
998  */
999 #if defined(CONFIG_KALLSYMS) && defined(CONFIG_SYSFS)
1000 struct module_sect_attr
1001 {
1002         struct module_attribute mattr;
1003         char *name;
1004         unsigned long address;
1005 };
1006
1007 struct module_sect_attrs
1008 {
1009         struct attribute_group grp;
1010         unsigned int nsections;
1011         struct module_sect_attr attrs[0];
1012 };
1013
1014 static ssize_t module_sect_show(struct module_attribute *mattr,
1015                                 struct module *mod, char *buf)
1016 {
1017         struct module_sect_attr *sattr =
1018                 container_of(mattr, struct module_sect_attr, mattr);
1019         return sprintf(buf, "0x%lx\n", sattr->address);
1020 }
1021
1022 static void free_sect_attrs(struct module_sect_attrs *sect_attrs)
1023 {
1024         unsigned int section;
1025
1026         for (section = 0; section < sect_attrs->nsections; section++)
1027                 kfree(sect_attrs->attrs[section].name);
1028         kfree(sect_attrs);
1029 }
1030
1031 static void add_sect_attrs(struct module *mod, unsigned int nsect,
1032                 char *secstrings, Elf_Shdr *sechdrs)
1033 {
1034         unsigned int nloaded = 0, i, size[2];
1035         struct module_sect_attrs *sect_attrs;
1036         struct module_sect_attr *sattr;
1037         struct attribute **gattr;
1038
1039         /* Count loaded sections and allocate structures */
1040         for (i = 0; i < nsect; i++)
1041                 if (sechdrs[i].sh_flags & SHF_ALLOC)
1042                         nloaded++;
1043         size[0] = ALIGN(sizeof(*sect_attrs)
1044                         + nloaded * sizeof(sect_attrs->attrs[0]),
1045                         sizeof(sect_attrs->grp.attrs[0]));
1046         size[1] = (nloaded + 1) * sizeof(sect_attrs->grp.attrs[0]);
1047         sect_attrs = kzalloc(size[0] + size[1], GFP_KERNEL);
1048         if (sect_attrs == NULL)
1049                 return;
1050
1051         /* Setup section attributes. */
1052         sect_attrs->grp.name = "sections";
1053         sect_attrs->grp.attrs = (void *)sect_attrs + size[0];
1054
1055         sect_attrs->nsections = 0;
1056         sattr = &sect_attrs->attrs[0];
1057         gattr = &sect_attrs->grp.attrs[0];
1058         for (i = 0; i < nsect; i++) {
1059                 if (! (sechdrs[i].sh_flags & SHF_ALLOC))
1060                         continue;
1061                 sattr->address = sechdrs[i].sh_addr;
1062                 sattr->name = kstrdup(secstrings + sechdrs[i].sh_name,
1063                                         GFP_KERNEL);
1064                 if (sattr->name == NULL)
1065                         goto out;
1066                 sect_attrs->nsections++;
1067                 sattr->mattr.show = module_sect_show;
1068                 sattr->mattr.store = NULL;
1069                 sattr->mattr.attr.name = sattr->name;
1070                 sattr->mattr.attr.mode = S_IRUGO;
1071                 *(gattr++) = &(sattr++)->mattr.attr;
1072         }
1073         *gattr = NULL;
1074
1075         if (sysfs_create_group(&mod->mkobj.kobj, &sect_attrs->grp))
1076                 goto out;
1077
1078         mod->sect_attrs = sect_attrs;
1079         return;
1080   out:
1081         free_sect_attrs(sect_attrs);
1082 }
1083
1084 static void remove_sect_attrs(struct module *mod)
1085 {
1086         if (mod->sect_attrs) {
1087                 sysfs_remove_group(&mod->mkobj.kobj,
1088                                    &mod->sect_attrs->grp);
1089                 /* We are positive that no one is using any sect attrs
1090                  * at this point.  Deallocate immediately. */
1091                 free_sect_attrs(mod->sect_attrs);
1092                 mod->sect_attrs = NULL;
1093         }
1094 }
1095
1096 /*
1097  * /sys/module/foo/notes/.section.name gives contents of SHT_NOTE sections.
1098  */
1099
1100 struct module_notes_attrs {
1101         struct kobject *dir;
1102         unsigned int notes;
1103         struct bin_attribute attrs[0];
1104 };
1105
1106 static ssize_t module_notes_read(struct kobject *kobj,
1107                                  struct bin_attribute *bin_attr,
1108                                  char *buf, loff_t pos, size_t count)
1109 {
1110         /*
1111          * The caller checked the pos and count against our size.
1112          */
1113         memcpy(buf, bin_attr->private + pos, count);
1114         return count;
1115 }
1116
1117 static void free_notes_attrs(struct module_notes_attrs *notes_attrs,
1118                              unsigned int i)
1119 {
1120         if (notes_attrs->dir) {
1121                 while (i-- > 0)
1122                         sysfs_remove_bin_file(notes_attrs->dir,
1123                                               &notes_attrs->attrs[i]);
1124                 kobject_del(notes_attrs->dir);
1125         }
1126         kfree(notes_attrs);
1127 }
1128
1129 static void add_notes_attrs(struct module *mod, unsigned int nsect,
1130                             char *secstrings, Elf_Shdr *sechdrs)
1131 {
1132         unsigned int notes, loaded, i;
1133         struct module_notes_attrs *notes_attrs;
1134         struct bin_attribute *nattr;
1135
1136         /* Count notes sections and allocate structures.  */
1137         notes = 0;
1138         for (i = 0; i < nsect; i++)
1139                 if ((sechdrs[i].sh_flags & SHF_ALLOC) &&
1140                     (sechdrs[i].sh_type == SHT_NOTE))
1141                         ++notes;
1142
1143         if (notes == 0)
1144                 return;
1145
1146         notes_attrs = kzalloc(sizeof(*notes_attrs)
1147                               + notes * sizeof(notes_attrs->attrs[0]),
1148                               GFP_KERNEL);
1149         if (notes_attrs == NULL)
1150                 return;
1151
1152         notes_attrs->notes = notes;
1153         nattr = &notes_attrs->attrs[0];
1154         for (loaded = i = 0; i < nsect; ++i) {
1155                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1156                         continue;
1157                 if (sechdrs[i].sh_type == SHT_NOTE) {
1158                         nattr->attr.name = mod->sect_attrs->attrs[loaded].name;
1159                         nattr->attr.mode = S_IRUGO;
1160                         nattr->size = sechdrs[i].sh_size;
1161                         nattr->private = (void *) sechdrs[i].sh_addr;
1162                         nattr->read = module_notes_read;
1163                         ++nattr;
1164                 }
1165                 ++loaded;
1166         }
1167
1168         notes_attrs->dir = kobject_create_and_add("notes", &mod->mkobj.kobj);
1169         if (!notes_attrs->dir)
1170                 goto out;
1171
1172         for (i = 0; i < notes; ++i)
1173                 if (sysfs_create_bin_file(notes_attrs->dir,
1174                                           &notes_attrs->attrs[i]))
1175                         goto out;
1176
1177         mod->notes_attrs = notes_attrs;
1178         return;
1179
1180   out:
1181         free_notes_attrs(notes_attrs, i);
1182 }
1183
1184 static void remove_notes_attrs(struct module *mod)
1185 {
1186         if (mod->notes_attrs)
1187                 free_notes_attrs(mod->notes_attrs, mod->notes_attrs->notes);
1188 }
1189
1190 #else
1191
1192 static inline void add_sect_attrs(struct module *mod, unsigned int nsect,
1193                 char *sectstrings, Elf_Shdr *sechdrs)
1194 {
1195 }
1196
1197 static inline void remove_sect_attrs(struct module *mod)
1198 {
1199 }
1200
1201 static inline void add_notes_attrs(struct module *mod, unsigned int nsect,
1202                                    char *sectstrings, Elf_Shdr *sechdrs)
1203 {
1204 }
1205
1206 static inline void remove_notes_attrs(struct module *mod)
1207 {
1208 }
1209 #endif
1210
1211 #ifdef CONFIG_SYSFS
1212 int module_add_modinfo_attrs(struct module *mod)
1213 {
1214         struct module_attribute *attr;
1215         struct module_attribute *temp_attr;
1216         int error = 0;
1217         int i;
1218
1219         mod->modinfo_attrs = kzalloc((sizeof(struct module_attribute) *
1220                                         (ARRAY_SIZE(modinfo_attrs) + 1)),
1221                                         GFP_KERNEL);
1222         if (!mod->modinfo_attrs)
1223                 return -ENOMEM;
1224
1225         temp_attr = mod->modinfo_attrs;
1226         for (i = 0; (attr = modinfo_attrs[i]) && !error; i++) {
1227                 if (!attr->test ||
1228                     (attr->test && attr->test(mod))) {
1229                         memcpy(temp_attr, attr, sizeof(*temp_attr));
1230                         error = sysfs_create_file(&mod->mkobj.kobj,&temp_attr->attr);
1231                         ++temp_attr;
1232                 }
1233         }
1234         return error;
1235 }
1236
1237 void module_remove_modinfo_attrs(struct module *mod)
1238 {
1239         struct module_attribute *attr;
1240         int i;
1241
1242         for (i = 0; (attr = &mod->modinfo_attrs[i]); i++) {
1243                 /* pick a field to test for end of list */
1244                 if (!attr->attr.name)
1245                         break;
1246                 sysfs_remove_file(&mod->mkobj.kobj,&attr->attr);
1247                 if (attr->free)
1248                         attr->free(mod);
1249         }
1250         kfree(mod->modinfo_attrs);
1251 }
1252
1253 int mod_sysfs_init(struct module *mod)
1254 {
1255         int err;
1256         struct kobject *kobj;
1257
1258         if (!module_sysfs_initialized) {
1259                 printk(KERN_ERR "%s: module sysfs not initialized\n",
1260                        mod->name);
1261                 err = -EINVAL;
1262                 goto out;
1263         }
1264
1265         kobj = kset_find_obj(module_kset, mod->name);
1266         if (kobj) {
1267                 printk(KERN_ERR "%s: module is already loaded\n", mod->name);
1268                 kobject_put(kobj);
1269                 err = -EINVAL;
1270                 goto out;
1271         }
1272
1273         mod->mkobj.mod = mod;
1274
1275         memset(&mod->mkobj.kobj, 0, sizeof(mod->mkobj.kobj));
1276         mod->mkobj.kobj.kset = module_kset;
1277         err = kobject_init_and_add(&mod->mkobj.kobj, &module_ktype, NULL,
1278                                    "%s", mod->name);
1279         if (err)
1280                 kobject_put(&mod->mkobj.kobj);
1281
1282         /* delay uevent until full sysfs population */
1283 out:
1284         return err;
1285 }
1286
1287 int mod_sysfs_setup(struct module *mod,
1288                            struct kernel_param *kparam,
1289                            unsigned int num_params)
1290 {
1291         int err;
1292
1293         mod->holders_dir = kobject_create_and_add("holders", &mod->mkobj.kobj);
1294         if (!mod->holders_dir) {
1295                 err = -ENOMEM;
1296                 goto out_unreg;
1297         }
1298
1299         err = module_param_sysfs_setup(mod, kparam, num_params);
1300         if (err)
1301                 goto out_unreg_holders;
1302
1303         err = module_add_modinfo_attrs(mod);
1304         if (err)
1305                 goto out_unreg_param;
1306
1307         kobject_uevent(&mod->mkobj.kobj, KOBJ_ADD);
1308         return 0;
1309
1310 out_unreg_param:
1311         module_param_sysfs_remove(mod);
1312 out_unreg_holders:
1313         kobject_put(mod->holders_dir);
1314 out_unreg:
1315         kobject_put(&mod->mkobj.kobj);
1316         return err;
1317 }
1318 #endif
1319
1320 static void mod_kobject_remove(struct module *mod)
1321 {
1322         module_remove_modinfo_attrs(mod);
1323         module_param_sysfs_remove(mod);
1324         kobject_put(mod->mkobj.drivers_dir);
1325         kobject_put(mod->holders_dir);
1326         kobject_put(&mod->mkobj.kobj);
1327 }
1328
1329 /*
1330  * link the module with the whole machine is stopped with interrupts off
1331  * - this defends against kallsyms not taking locks
1332  */
1333 static int __link_module(void *_mod)
1334 {
1335         struct module *mod = _mod;
1336         list_add(&mod->list, &modules);
1337         return 0;
1338 }
1339
1340 /*
1341  * unlink the module with the whole machine is stopped with interrupts off
1342  * - this defends against kallsyms not taking locks
1343  */
1344 static int __unlink_module(void *_mod)
1345 {
1346         struct module *mod = _mod;
1347         list_del(&mod->list);
1348         return 0;
1349 }
1350
1351 /* Free a module, remove from lists, etc (must hold module_mutex). */
1352 static void free_module(struct module *mod)
1353 {
1354         /* Delete from various lists */
1355         stop_machine_run(__unlink_module, mod, NR_CPUS);
1356         remove_notes_attrs(mod);
1357         remove_sect_attrs(mod);
1358         mod_kobject_remove(mod);
1359
1360         unwind_remove_table(mod->unwind_info, 0);
1361
1362         /* Arch-specific cleanup. */
1363         module_arch_cleanup(mod);
1364
1365         /* Module unload stuff */
1366         module_unload_free(mod);
1367
1368         /* This may be NULL, but that's OK */
1369         module_free(mod, mod->module_init);
1370         kfree(mod->args);
1371         if (mod->percpu)
1372                 percpu_modfree(mod->percpu);
1373
1374         /* Free lock-classes: */
1375         lockdep_free_key_range(mod->module_core, mod->core_size);
1376
1377         /* Finally, free the core (containing the module structure) */
1378         module_free(mod, mod->module_core);
1379 }
1380
1381 void *__symbol_get(const char *symbol)
1382 {
1383         struct module *owner;
1384         unsigned long value;
1385
1386         preempt_disable();
1387         value = find_symbol(symbol, &owner, NULL, true, true);
1388         if (IS_ERR_VALUE(value))
1389                 value = 0;
1390         else if (strong_try_module_get(owner))
1391                 value = 0;
1392         preempt_enable();
1393
1394         return (void *)value;
1395 }
1396 EXPORT_SYMBOL_GPL(__symbol_get);
1397
1398 /*
1399  * Ensure that an exported symbol [global namespace] does not already exist
1400  * in the kernel or in some other module's exported symbol table.
1401  */
1402 static int verify_export_symbols(struct module *mod)
1403 {
1404         unsigned int i;
1405         struct module *owner;
1406         const struct kernel_symbol *s;
1407         struct {
1408                 const struct kernel_symbol *sym;
1409                 unsigned int num;
1410         } arr[] = {
1411                 { mod->syms, mod->num_syms },
1412                 { mod->gpl_syms, mod->num_gpl_syms },
1413                 { mod->gpl_future_syms, mod->num_gpl_future_syms },
1414                 { mod->unused_syms, mod->num_unused_syms },
1415                 { mod->unused_gpl_syms, mod->num_unused_gpl_syms },
1416         };
1417
1418         for (i = 0; i < ARRAY_SIZE(arr); i++) {
1419                 for (s = arr[i].sym; s < arr[i].sym + arr[i].num; s++) {
1420                         if (!IS_ERR_VALUE(find_symbol(s->name, &owner,
1421                                                       NULL, true, false))) {
1422                                 printk(KERN_ERR
1423                                        "%s: exports duplicate symbol %s"
1424                                        " (owned by %s)\n",
1425                                        mod->name, s->name, module_name(owner));
1426                                 return -ENOEXEC;
1427                         }
1428                 }
1429         }
1430         return 0;
1431 }
1432
1433 /* Change all symbols so that st_value encodes the pointer directly. */
1434 static int simplify_symbols(Elf_Shdr *sechdrs,
1435                             unsigned int symindex,
1436                             const char *strtab,
1437                             unsigned int versindex,
1438                             unsigned int pcpuindex,
1439                             struct module *mod)
1440 {
1441         Elf_Sym *sym = (void *)sechdrs[symindex].sh_addr;
1442         unsigned long secbase;
1443         unsigned int i, n = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1444         int ret = 0;
1445
1446         for (i = 1; i < n; i++) {
1447                 switch (sym[i].st_shndx) {
1448                 case SHN_COMMON:
1449                         /* We compiled with -fno-common.  These are not
1450                            supposed to happen.  */
1451                         DEBUGP("Common symbol: %s\n", strtab + sym[i].st_name);
1452                         printk("%s: please compile with -fno-common\n",
1453                                mod->name);
1454                         ret = -ENOEXEC;
1455                         break;
1456
1457                 case SHN_ABS:
1458                         /* Don't need to do anything */
1459                         DEBUGP("Absolute symbol: 0x%08lx\n",
1460                                (long)sym[i].st_value);
1461                         break;
1462
1463                 case SHN_UNDEF:
1464                         sym[i].st_value
1465                           = resolve_symbol(sechdrs, versindex,
1466                                            strtab + sym[i].st_name, mod);
1467
1468                         /* Ok if resolved.  */
1469                         if (!IS_ERR_VALUE(sym[i].st_value))
1470                                 break;
1471                         /* Ok if weak.  */
1472                         if (ELF_ST_BIND(sym[i].st_info) == STB_WEAK)
1473                                 break;
1474
1475                         printk(KERN_WARNING "%s: Unknown symbol %s\n",
1476                                mod->name, strtab + sym[i].st_name);
1477                         ret = -ENOENT;
1478                         break;
1479
1480                 default:
1481                         /* Divert to percpu allocation if a percpu var. */
1482                         if (sym[i].st_shndx == pcpuindex)
1483                                 secbase = (unsigned long)mod->percpu;
1484                         else
1485                                 secbase = sechdrs[sym[i].st_shndx].sh_addr;
1486                         sym[i].st_value += secbase;
1487                         break;
1488                 }
1489         }
1490
1491         return ret;
1492 }
1493
1494 /* Update size with this section: return offset. */
1495 static long get_offset(unsigned long *size, Elf_Shdr *sechdr)
1496 {
1497         long ret;
1498
1499         ret = ALIGN(*size, sechdr->sh_addralign ?: 1);
1500         *size = ret + sechdr->sh_size;
1501         return ret;
1502 }
1503
1504 /* Lay out the SHF_ALLOC sections in a way not dissimilar to how ld
1505    might -- code, read-only data, read-write data, small data.  Tally
1506    sizes, and place the offsets into sh_entsize fields: high bit means it
1507    belongs in init. */
1508 static void layout_sections(struct module *mod,
1509                             const Elf_Ehdr *hdr,
1510                             Elf_Shdr *sechdrs,
1511                             const char *secstrings)
1512 {
1513         static unsigned long const masks[][2] = {
1514                 /* NOTE: all executable code must be the first section
1515                  * in this array; otherwise modify the text_size
1516                  * finder in the two loops below */
1517                 { SHF_EXECINSTR | SHF_ALLOC, ARCH_SHF_SMALL },
1518                 { SHF_ALLOC, SHF_WRITE | ARCH_SHF_SMALL },
1519                 { SHF_WRITE | SHF_ALLOC, ARCH_SHF_SMALL },
1520                 { ARCH_SHF_SMALL | SHF_ALLOC, 0 }
1521         };
1522         unsigned int m, i;
1523
1524         for (i = 0; i < hdr->e_shnum; i++)
1525                 sechdrs[i].sh_entsize = ~0UL;
1526
1527         DEBUGP("Core section allocation order:\n");
1528         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1529                 for (i = 0; i < hdr->e_shnum; ++i) {
1530                         Elf_Shdr *s = &sechdrs[i];
1531
1532                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1533                             || (s->sh_flags & masks[m][1])
1534                             || s->sh_entsize != ~0UL
1535                             || strncmp(secstrings + s->sh_name,
1536                                        ".init", 5) == 0)
1537                                 continue;
1538                         s->sh_entsize = get_offset(&mod->core_size, s);
1539                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1540                 }
1541                 if (m == 0)
1542                         mod->core_text_size = mod->core_size;
1543         }
1544
1545         DEBUGP("Init section allocation order:\n");
1546         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1547                 for (i = 0; i < hdr->e_shnum; ++i) {
1548                         Elf_Shdr *s = &sechdrs[i];
1549
1550                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1551                             || (s->sh_flags & masks[m][1])
1552                             || s->sh_entsize != ~0UL
1553                             || strncmp(secstrings + s->sh_name,
1554                                        ".init", 5) != 0)
1555                                 continue;
1556                         s->sh_entsize = (get_offset(&mod->init_size, s)
1557                                          | INIT_OFFSET_MASK);
1558                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1559                 }
1560                 if (m == 0)
1561                         mod->init_text_size = mod->init_size;
1562         }
1563 }
1564
1565 static void set_license(struct module *mod, const char *license)
1566 {
1567         if (!license)
1568                 license = "unspecified";
1569
1570         if (!license_is_gpl_compatible(license)) {
1571                 if (!(tainted & TAINT_PROPRIETARY_MODULE))
1572                         printk(KERN_WARNING "%s: module license '%s' taints "
1573                                 "kernel.\n", mod->name, license);
1574                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1575         }
1576 }
1577
1578 /* Parse tag=value strings from .modinfo section */
1579 static char *next_string(char *string, unsigned long *secsize)
1580 {
1581         /* Skip non-zero chars */
1582         while (string[0]) {
1583                 string++;
1584                 if ((*secsize)-- <= 1)
1585                         return NULL;
1586         }
1587
1588         /* Skip any zero padding. */
1589         while (!string[0]) {
1590                 string++;
1591                 if ((*secsize)-- <= 1)
1592                         return NULL;
1593         }
1594         return string;
1595 }
1596
1597 static char *get_modinfo(Elf_Shdr *sechdrs,
1598                          unsigned int info,
1599                          const char *tag)
1600 {
1601         char *p;
1602         unsigned int taglen = strlen(tag);
1603         unsigned long size = sechdrs[info].sh_size;
1604
1605         for (p = (char *)sechdrs[info].sh_addr; p; p = next_string(p, &size)) {
1606                 if (strncmp(p, tag, taglen) == 0 && p[taglen] == '=')
1607                         return p + taglen + 1;
1608         }
1609         return NULL;
1610 }
1611
1612 static void setup_modinfo(struct module *mod, Elf_Shdr *sechdrs,
1613                           unsigned int infoindex)
1614 {
1615         struct module_attribute *attr;
1616         int i;
1617
1618         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1619                 if (attr->setup)
1620                         attr->setup(mod,
1621                                     get_modinfo(sechdrs,
1622                                                 infoindex,
1623                                                 attr->attr.name));
1624         }
1625 }
1626
1627 #ifdef CONFIG_KALLSYMS
1628 static int is_exported(const char *name, const struct module *mod)
1629 {
1630         if (!mod && lookup_symbol(name, __start___ksymtab, __stop___ksymtab))
1631                 return 1;
1632         else
1633                 if (mod && lookup_symbol(name, mod->syms, mod->syms + mod->num_syms))
1634                         return 1;
1635                 else
1636                         return 0;
1637 }
1638
1639 /* As per nm */
1640 static char elf_type(const Elf_Sym *sym,
1641                      Elf_Shdr *sechdrs,
1642                      const char *secstrings,
1643                      struct module *mod)
1644 {
1645         if (ELF_ST_BIND(sym->st_info) == STB_WEAK) {
1646                 if (ELF_ST_TYPE(sym->st_info) == STT_OBJECT)
1647                         return 'v';
1648                 else
1649                         return 'w';
1650         }
1651         if (sym->st_shndx == SHN_UNDEF)
1652                 return 'U';
1653         if (sym->st_shndx == SHN_ABS)
1654                 return 'a';
1655         if (sym->st_shndx >= SHN_LORESERVE)
1656                 return '?';
1657         if (sechdrs[sym->st_shndx].sh_flags & SHF_EXECINSTR)
1658                 return 't';
1659         if (sechdrs[sym->st_shndx].sh_flags & SHF_ALLOC
1660             && sechdrs[sym->st_shndx].sh_type != SHT_NOBITS) {
1661                 if (!(sechdrs[sym->st_shndx].sh_flags & SHF_WRITE))
1662                         return 'r';
1663                 else if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1664                         return 'g';
1665                 else
1666                         return 'd';
1667         }
1668         if (sechdrs[sym->st_shndx].sh_type == SHT_NOBITS) {
1669                 if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1670                         return 's';
1671                 else
1672                         return 'b';
1673         }
1674         if (strncmp(secstrings + sechdrs[sym->st_shndx].sh_name,
1675                     ".debug", strlen(".debug")) == 0)
1676                 return 'n';
1677         return '?';
1678 }
1679
1680 static void add_kallsyms(struct module *mod,
1681                          Elf_Shdr *sechdrs,
1682                          unsigned int symindex,
1683                          unsigned int strindex,
1684                          const char *secstrings)
1685 {
1686         unsigned int i;
1687
1688         mod->symtab = (void *)sechdrs[symindex].sh_addr;
1689         mod->num_symtab = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1690         mod->strtab = (void *)sechdrs[strindex].sh_addr;
1691
1692         /* Set types up while we still have access to sections. */
1693         for (i = 0; i < mod->num_symtab; i++)
1694                 mod->symtab[i].st_info
1695                         = elf_type(&mod->symtab[i], sechdrs, secstrings, mod);
1696 }
1697 #else
1698 static inline void add_kallsyms(struct module *mod,
1699                                 Elf_Shdr *sechdrs,
1700                                 unsigned int symindex,
1701                                 unsigned int strindex,
1702                                 const char *secstrings)
1703 {
1704 }
1705 #endif /* CONFIG_KALLSYMS */
1706
1707 /* Allocate and load the module: note that size of section 0 is always
1708    zero, and we rely on this for optional sections. */
1709 static struct module *load_module(void __user *umod,
1710                                   unsigned long len,
1711                                   const char __user *uargs)
1712 {
1713         Elf_Ehdr *hdr;
1714         Elf_Shdr *sechdrs;
1715         char *secstrings, *args, *modmagic, *strtab = NULL;
1716         unsigned int i;
1717         unsigned int symindex = 0;
1718         unsigned int strindex = 0;
1719         unsigned int setupindex;
1720         unsigned int exindex;
1721         unsigned int exportindex;
1722         unsigned int modindex;
1723         unsigned int obsparmindex;
1724         unsigned int infoindex;
1725         unsigned int gplindex;
1726         unsigned int crcindex;
1727         unsigned int gplcrcindex;
1728         unsigned int versindex;
1729         unsigned int pcpuindex;
1730         unsigned int gplfutureindex;
1731         unsigned int gplfuturecrcindex;
1732         unsigned int unwindex = 0;
1733         unsigned int unusedindex;
1734         unsigned int unusedcrcindex;
1735         unsigned int unusedgplindex;
1736         unsigned int unusedgplcrcindex;
1737         unsigned int markersindex;
1738         unsigned int markersstringsindex;
1739         struct module *mod;
1740         long err = 0;
1741         void *percpu = NULL, *ptr = NULL; /* Stops spurious gcc warning */
1742         struct exception_table_entry *extable;
1743         mm_segment_t old_fs;
1744
1745         DEBUGP("load_module: umod=%p, len=%lu, uargs=%p\n",
1746                umod, len, uargs);
1747         if (len < sizeof(*hdr))
1748                 return ERR_PTR(-ENOEXEC);
1749
1750         /* Suck in entire file: we'll want most of it. */
1751         /* vmalloc barfs on "unusual" numbers.  Check here */
1752         if (len > 64 * 1024 * 1024 || (hdr = vmalloc(len)) == NULL)
1753                 return ERR_PTR(-ENOMEM);
1754         if (copy_from_user(hdr, umod, len) != 0) {
1755                 err = -EFAULT;
1756                 goto free_hdr;
1757         }
1758
1759         /* Sanity checks against insmoding binaries or wrong arch,
1760            weird elf version */
1761         if (memcmp(hdr->e_ident, ELFMAG, 4) != 0
1762             || hdr->e_type != ET_REL
1763             || !elf_check_arch(hdr)
1764             || hdr->e_shentsize != sizeof(*sechdrs)) {
1765                 err = -ENOEXEC;
1766                 goto free_hdr;
1767         }
1768
1769         if (len < hdr->e_shoff + hdr->e_shnum * sizeof(Elf_Shdr))
1770                 goto truncated;
1771
1772         /* Convenience variables */
1773         sechdrs = (void *)hdr + hdr->e_shoff;
1774         secstrings = (void *)hdr + sechdrs[hdr->e_shstrndx].sh_offset;
1775         sechdrs[0].sh_addr = 0;
1776
1777         for (i = 1; i < hdr->e_shnum; i++) {
1778                 if (sechdrs[i].sh_type != SHT_NOBITS
1779                     && len < sechdrs[i].sh_offset + sechdrs[i].sh_size)
1780                         goto truncated;
1781
1782                 /* Mark all sections sh_addr with their address in the
1783                    temporary image. */
1784                 sechdrs[i].sh_addr = (size_t)hdr + sechdrs[i].sh_offset;
1785
1786                 /* Internal symbols and strings. */
1787                 if (sechdrs[i].sh_type == SHT_SYMTAB) {
1788                         symindex = i;
1789                         strindex = sechdrs[i].sh_link;
1790                         strtab = (char *)hdr + sechdrs[strindex].sh_offset;
1791                 }
1792 #ifndef CONFIG_MODULE_UNLOAD
1793                 /* Don't load .exit sections */
1794                 if (strncmp(secstrings+sechdrs[i].sh_name, ".exit", 5) == 0)
1795                         sechdrs[i].sh_flags &= ~(unsigned long)SHF_ALLOC;
1796 #endif
1797         }
1798
1799         modindex = find_sec(hdr, sechdrs, secstrings,
1800                             ".gnu.linkonce.this_module");
1801         if (!modindex) {
1802                 printk(KERN_WARNING "No module found in object\n");
1803                 err = -ENOEXEC;
1804                 goto free_hdr;
1805         }
1806         mod = (void *)sechdrs[modindex].sh_addr;
1807
1808         if (symindex == 0) {
1809                 printk(KERN_WARNING "%s: module has no symbols (stripped?)\n",
1810                        mod->name);
1811                 err = -ENOEXEC;
1812                 goto free_hdr;
1813         }
1814
1815         /* Optional sections */
1816         exportindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab");
1817         gplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl");
1818         gplfutureindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl_future");
1819         unusedindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused");
1820         unusedgplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused_gpl");
1821         crcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab");
1822         gplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl");
1823         gplfuturecrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl_future");
1824         unusedcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused");
1825         unusedgplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused_gpl");
1826         setupindex = find_sec(hdr, sechdrs, secstrings, "__param");
1827         exindex = find_sec(hdr, sechdrs, secstrings, "__ex_table");
1828         obsparmindex = find_sec(hdr, sechdrs, secstrings, "__obsparm");
1829         versindex = find_sec(hdr, sechdrs, secstrings, "__versions");
1830         infoindex = find_sec(hdr, sechdrs, secstrings, ".modinfo");
1831         pcpuindex = find_pcpusec(hdr, sechdrs, secstrings);
1832 #ifdef ARCH_UNWIND_SECTION_NAME
1833         unwindex = find_sec(hdr, sechdrs, secstrings, ARCH_UNWIND_SECTION_NAME);
1834 #endif
1835
1836         /* Don't keep modinfo and version sections. */
1837         sechdrs[infoindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1838         sechdrs[versindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1839 #ifdef CONFIG_KALLSYMS
1840         /* Keep symbol and string tables for decoding later. */
1841         sechdrs[symindex].sh_flags |= SHF_ALLOC;
1842         sechdrs[strindex].sh_flags |= SHF_ALLOC;
1843 #endif
1844         if (unwindex)
1845                 sechdrs[unwindex].sh_flags |= SHF_ALLOC;
1846
1847         /* Check module struct version now, before we try to use module. */
1848         if (!check_modstruct_version(sechdrs, versindex, mod)) {
1849                 err = -ENOEXEC;
1850                 goto free_hdr;
1851         }
1852
1853         modmagic = get_modinfo(sechdrs, infoindex, "vermagic");
1854         /* This is allowed: modprobe --force will invalidate it. */
1855         if (!modmagic) {
1856                 add_taint_module(mod, TAINT_FORCED_MODULE);
1857                 printk(KERN_WARNING "%s: no version magic, tainting kernel.\n",
1858                        mod->name);
1859         } else if (!same_magic(modmagic, vermagic)) {
1860                 printk(KERN_ERR "%s: version magic '%s' should be '%s'\n",
1861                        mod->name, modmagic, vermagic);
1862                 err = -ENOEXEC;
1863                 goto free_hdr;
1864         }
1865
1866         /* Now copy in args */
1867         args = strndup_user(uargs, ~0UL >> 1);
1868         if (IS_ERR(args)) {
1869                 err = PTR_ERR(args);
1870                 goto free_hdr;
1871         }
1872
1873         if (find_module(mod->name)) {
1874                 err = -EEXIST;
1875                 goto free_mod;
1876         }
1877
1878         mod->state = MODULE_STATE_COMING;
1879
1880         /* Allow arches to frob section contents and sizes.  */
1881         err = module_frob_arch_sections(hdr, sechdrs, secstrings, mod);
1882         if (err < 0)
1883                 goto free_mod;
1884
1885         if (pcpuindex) {
1886                 /* We have a special allocation for this section. */
1887                 percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
1888                                          sechdrs[pcpuindex].sh_addralign,
1889                                          mod->name);
1890                 if (!percpu) {
1891                         err = -ENOMEM;
1892                         goto free_mod;
1893                 }
1894                 sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1895                 mod->percpu = percpu;
1896         }
1897
1898         /* Determine total sizes, and put offsets in sh_entsize.  For now
1899            this is done generically; there doesn't appear to be any
1900            special cases for the architectures. */
1901         layout_sections(mod, hdr, sechdrs, secstrings);
1902
1903         /* Do the allocs. */
1904         ptr = module_alloc(mod->core_size);
1905         if (!ptr) {
1906                 err = -ENOMEM;
1907                 goto free_percpu;
1908         }
1909         memset(ptr, 0, mod->core_size);
1910         mod->module_core = ptr;
1911
1912         ptr = module_alloc(mod->init_size);
1913         if (!ptr && mod->init_size) {
1914                 err = -ENOMEM;
1915                 goto free_core;
1916         }
1917         memset(ptr, 0, mod->init_size);
1918         mod->module_init = ptr;
1919
1920         /* Transfer each section which specifies SHF_ALLOC */
1921         DEBUGP("final section addresses:\n");
1922         for (i = 0; i < hdr->e_shnum; i++) {
1923                 void *dest;
1924
1925                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1926                         continue;
1927
1928                 if (sechdrs[i].sh_entsize & INIT_OFFSET_MASK)
1929                         dest = mod->module_init
1930                                 + (sechdrs[i].sh_entsize & ~INIT_OFFSET_MASK);
1931                 else
1932                         dest = mod->module_core + sechdrs[i].sh_entsize;
1933
1934                 if (sechdrs[i].sh_type != SHT_NOBITS)
1935                         memcpy(dest, (void *)sechdrs[i].sh_addr,
1936                                sechdrs[i].sh_size);
1937                 /* Update sh_addr to point to copy in image. */
1938                 sechdrs[i].sh_addr = (unsigned long)dest;
1939                 DEBUGP("\t0x%lx %s\n", sechdrs[i].sh_addr, secstrings + sechdrs[i].sh_name);
1940         }
1941         /* Module has been moved. */
1942         mod = (void *)sechdrs[modindex].sh_addr;
1943
1944         /* Now we've moved module, initialize linked lists, etc. */
1945         module_unload_init(mod);
1946
1947         /* add kobject, so we can reference it. */
1948         err = mod_sysfs_init(mod);
1949         if (err)
1950                 goto free_unload;
1951
1952         /* Set up license info based on the info section */
1953         set_license(mod, get_modinfo(sechdrs, infoindex, "license"));
1954
1955         /*
1956          * ndiswrapper is under GPL by itself, but loads proprietary modules.
1957          * Don't use add_taint_module(), as it would prevent ndiswrapper from
1958          * using GPL-only symbols it needs.
1959          */
1960         if (strcmp(mod->name, "ndiswrapper") == 0)
1961                 add_taint(TAINT_PROPRIETARY_MODULE);
1962
1963         /* driverloader was caught wrongly pretending to be under GPL */
1964         if (strcmp(mod->name, "driverloader") == 0)
1965                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1966
1967         /* Set up MODINFO_ATTR fields */
1968         setup_modinfo(mod, sechdrs, infoindex);
1969
1970         /* Fix up syms, so that st_value is a pointer to location. */
1971         err = simplify_symbols(sechdrs, symindex, strtab, versindex, pcpuindex,
1972                                mod);
1973         if (err < 0)
1974                 goto cleanup;
1975
1976         /* Set up EXPORTed & EXPORT_GPLed symbols (section 0 is 0 length) */
1977         mod->num_syms = sechdrs[exportindex].sh_size / sizeof(*mod->syms);
1978         mod->syms = (void *)sechdrs[exportindex].sh_addr;
1979         if (crcindex)
1980                 mod->crcs = (void *)sechdrs[crcindex].sh_addr;
1981         mod->num_gpl_syms = sechdrs[gplindex].sh_size / sizeof(*mod->gpl_syms);
1982         mod->gpl_syms = (void *)sechdrs[gplindex].sh_addr;
1983         if (gplcrcindex)
1984                 mod->gpl_crcs = (void *)sechdrs[gplcrcindex].sh_addr;
1985         mod->num_gpl_future_syms = sechdrs[gplfutureindex].sh_size /
1986                                         sizeof(*mod->gpl_future_syms);
1987         mod->num_unused_syms = sechdrs[unusedindex].sh_size /
1988                                         sizeof(*mod->unused_syms);
1989         mod->num_unused_gpl_syms = sechdrs[unusedgplindex].sh_size /
1990                                         sizeof(*mod->unused_gpl_syms);
1991         mod->gpl_future_syms = (void *)sechdrs[gplfutureindex].sh_addr;
1992         if (gplfuturecrcindex)
1993                 mod->gpl_future_crcs = (void *)sechdrs[gplfuturecrcindex].sh_addr;
1994
1995         mod->unused_syms = (void *)sechdrs[unusedindex].sh_addr;
1996         if (unusedcrcindex)
1997                 mod->unused_crcs = (void *)sechdrs[unusedcrcindex].sh_addr;
1998         mod->unused_gpl_syms = (void *)sechdrs[unusedgplindex].sh_addr;
1999         if (unusedgplcrcindex)
2000                 mod->unused_gpl_crcs
2001                         = (void *)sechdrs[unusedgplcrcindex].sh_addr;
2002
2003 #ifdef CONFIG_MODVERSIONS
2004         if ((mod->num_syms && !crcindex) ||
2005             (mod->num_gpl_syms && !gplcrcindex) ||
2006             (mod->num_gpl_future_syms && !gplfuturecrcindex) ||
2007             (mod->num_unused_syms && !unusedcrcindex) ||
2008             (mod->num_unused_gpl_syms && !unusedgplcrcindex)) {
2009                 printk(KERN_WARNING "%s: No versions for exported symbols."
2010                        " Tainting kernel.\n", mod->name);
2011                 add_taint_module(mod, TAINT_FORCED_MODULE);
2012         }
2013 #endif
2014         markersindex = find_sec(hdr, sechdrs, secstrings, "__markers");
2015         markersstringsindex = find_sec(hdr, sechdrs, secstrings,
2016                                         "__markers_strings");
2017
2018         /* Now do relocations. */
2019         for (i = 1; i < hdr->e_shnum; i++) {
2020                 const char *strtab = (char *)sechdrs[strindex].sh_addr;
2021                 unsigned int info = sechdrs[i].sh_info;
2022
2023                 /* Not a valid relocation section? */
2024                 if (info >= hdr->e_shnum)
2025                         continue;
2026
2027                 /* Don't bother with non-allocated sections */
2028                 if (!(sechdrs[info].sh_flags & SHF_ALLOC))
2029                         continue;
2030
2031                 if (sechdrs[i].sh_type == SHT_REL)
2032                         err = apply_relocate(sechdrs, strtab, symindex, i,mod);
2033                 else if (sechdrs[i].sh_type == SHT_RELA)
2034                         err = apply_relocate_add(sechdrs, strtab, symindex, i,
2035                                                  mod);
2036                 if (err < 0)
2037                         goto cleanup;
2038         }
2039 #ifdef CONFIG_MARKERS
2040         mod->markers = (void *)sechdrs[markersindex].sh_addr;
2041         mod->num_markers =
2042                 sechdrs[markersindex].sh_size / sizeof(*mod->markers);
2043 #endif
2044
2045         /* Find duplicate symbols */
2046         err = verify_export_symbols(mod);
2047
2048         if (err < 0)
2049                 goto cleanup;
2050
2051         /* Set up and sort exception table */
2052         mod->num_exentries = sechdrs[exindex].sh_size / sizeof(*mod->extable);
2053         mod->extable = extable = (void *)sechdrs[exindex].sh_addr;
2054         sort_extable(extable, extable + mod->num_exentries);
2055
2056         /* Finally, copy percpu area over. */
2057         percpu_modcopy(mod->percpu, (void *)sechdrs[pcpuindex].sh_addr,
2058                        sechdrs[pcpuindex].sh_size);
2059
2060         add_kallsyms(mod, sechdrs, symindex, strindex, secstrings);
2061
2062 #ifdef CONFIG_MARKERS
2063         if (!mod->taints)
2064                 marker_update_probe_range(mod->markers,
2065                         mod->markers + mod->num_markers);
2066 #endif
2067         err = module_finalize(hdr, sechdrs, mod);
2068         if (err < 0)
2069                 goto cleanup;
2070
2071         /* flush the icache in correct context */
2072         old_fs = get_fs();
2073         set_fs(KERNEL_DS);
2074
2075         /*
2076          * Flush the instruction cache, since we've played with text.
2077          * Do it before processing of module parameters, so the module
2078          * can provide parameter accessor functions of its own.
2079          */
2080         if (mod->module_init)
2081                 flush_icache_range((unsigned long)mod->module_init,
2082                                    (unsigned long)mod->module_init
2083                                    + mod->init_size);
2084         flush_icache_range((unsigned long)mod->module_core,
2085                            (unsigned long)mod->module_core + mod->core_size);
2086
2087         set_fs(old_fs);
2088
2089         mod->args = args;
2090         if (obsparmindex)
2091                 printk(KERN_WARNING "%s: Ignoring obsolete parameters\n",
2092                        mod->name);
2093
2094         /* Now sew it into the lists so we can get lockdep and oops
2095          * info during argument parsing.  Noone should access us, since
2096          * strong_try_module_get() will fail. */
2097         stop_machine_run(__link_module, mod, NR_CPUS);
2098
2099         /* Size of section 0 is 0, so this works well if no params */
2100         err = parse_args(mod->name, mod->args,
2101                          (struct kernel_param *)
2102                          sechdrs[setupindex].sh_addr,
2103                          sechdrs[setupindex].sh_size
2104                          / sizeof(struct kernel_param),
2105                          NULL);
2106         if (err < 0)
2107                 goto unlink;
2108
2109         err = mod_sysfs_setup(mod,
2110                               (struct kernel_param *)
2111                               sechdrs[setupindex].sh_addr,
2112                               sechdrs[setupindex].sh_size
2113                               / sizeof(struct kernel_param));
2114         if (err < 0)
2115                 goto unlink;
2116         add_sect_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2117         add_notes_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2118
2119         /* Size of section 0 is 0, so this works well if no unwind info. */
2120         mod->unwind_info = unwind_add_table(mod,
2121                                             (void *)sechdrs[unwindex].sh_addr,
2122                                             sechdrs[unwindex].sh_size);
2123
2124         /* Get rid of temporary copy */
2125         vfree(hdr);
2126
2127         /* Done! */
2128         return mod;
2129
2130  unlink:
2131         stop_machine_run(__unlink_module, mod, NR_CPUS);
2132         module_arch_cleanup(mod);
2133  cleanup:
2134         kobject_del(&mod->mkobj.kobj);
2135         kobject_put(&mod->mkobj.kobj);
2136  free_unload:
2137         module_unload_free(mod);
2138         module_free(mod, mod->module_init);
2139  free_core:
2140         module_free(mod, mod->module_core);
2141  free_percpu:
2142         if (percpu)
2143                 percpu_modfree(percpu);
2144  free_mod:
2145         kfree(args);
2146  free_hdr:
2147         vfree(hdr);
2148         return ERR_PTR(err);
2149
2150  truncated:
2151         printk(KERN_ERR "Module len %lu truncated\n", len);
2152         err = -ENOEXEC;
2153         goto free_hdr;
2154 }
2155
2156 /* This is where the real work happens */
2157 asmlinkage long
2158 sys_init_module(void __user *umod,
2159                 unsigned long len,
2160                 const char __user *uargs)
2161 {
2162         struct module *mod;
2163         int ret = 0;
2164
2165         /* Must have permission */
2166         if (!capable(CAP_SYS_MODULE))
2167                 return -EPERM;
2168
2169         /* Only one module load at a time, please */
2170         if (mutex_lock_interruptible(&module_mutex) != 0)
2171                 return -EINTR;
2172
2173         /* Do all the hard work */
2174         mod = load_module(umod, len, uargs);
2175         if (IS_ERR(mod)) {
2176                 mutex_unlock(&module_mutex);
2177                 return PTR_ERR(mod);
2178         }
2179
2180         /* Drop lock so they can recurse */
2181         mutex_unlock(&module_mutex);
2182
2183         blocking_notifier_call_chain(&module_notify_list,
2184                         MODULE_STATE_COMING, mod);
2185
2186         /* Start the module */
2187         if (mod->init != NULL)
2188                 ret = mod->init();
2189         if (ret < 0) {
2190                 /* Init routine failed: abort.  Try to protect us from
2191                    buggy refcounters. */
2192                 mod->state = MODULE_STATE_GOING;
2193                 synchronize_sched();
2194                 module_put(mod);
2195                 blocking_notifier_call_chain(&module_notify_list,
2196                                              MODULE_STATE_GOING, mod);
2197                 mutex_lock(&module_mutex);
2198                 free_module(mod);
2199                 mutex_unlock(&module_mutex);
2200                 wake_up(&module_wq);
2201                 return ret;
2202         }
2203         if (ret > 0) {
2204                 printk(KERN_WARNING "%s: '%s'->init suspiciously returned %d, "
2205                                     "it should follow 0/-E convention\n"
2206                        KERN_WARNING "%s: loading module anyway...\n",
2207                        __func__, mod->name, ret,
2208                        __func__);
2209                 dump_stack();
2210         }
2211
2212         /* Now it's a first class citizen!  Wake up anyone waiting for it. */
2213         mod->state = MODULE_STATE_LIVE;
2214         wake_up(&module_wq);
2215
2216         mutex_lock(&module_mutex);
2217         /* Drop initial reference. */
2218         module_put(mod);
2219         unwind_remove_table(mod->unwind_info, 1);
2220         module_free(mod, mod->module_init);
2221         mod->module_init = NULL;
2222         mod->init_size = 0;
2223         mod->init_text_size = 0;
2224         mutex_unlock(&module_mutex);
2225
2226         return 0;
2227 }
2228
2229 static inline int within(unsigned long addr, void *start, unsigned long size)
2230 {
2231         return ((void *)addr >= start && (void *)addr < start + size);
2232 }
2233
2234 #ifdef CONFIG_KALLSYMS
2235 /*
2236  * This ignores the intensely annoying "mapping symbols" found
2237  * in ARM ELF files: $a, $t and $d.
2238  */
2239 static inline int is_arm_mapping_symbol(const char *str)
2240 {
2241         return str[0] == '$' && strchr("atd", str[1])
2242                && (str[2] == '\0' || str[2] == '.');
2243 }
2244
2245 static const char *get_ksymbol(struct module *mod,
2246                                unsigned long addr,
2247                                unsigned long *size,
2248                                unsigned long *offset)
2249 {
2250         unsigned int i, best = 0;
2251         unsigned long nextval;
2252
2253         /* At worse, next value is at end of module */
2254         if (within(addr, mod->module_init, mod->init_size))
2255                 nextval = (unsigned long)mod->module_init+mod->init_text_size;
2256         else
2257                 nextval = (unsigned long)mod->module_core+mod->core_text_size;
2258
2259         /* Scan for closest preceeding symbol, and next symbol. (ELF
2260            starts real symbols at 1). */
2261         for (i = 1; i < mod->num_symtab; i++) {
2262                 if (mod->symtab[i].st_shndx == SHN_UNDEF)
2263                         continue;
2264
2265                 /* We ignore unnamed symbols: they're uninformative
2266                  * and inserted at a whim. */
2267                 if (mod->symtab[i].st_value <= addr
2268                     && mod->symtab[i].st_value > mod->symtab[best].st_value
2269                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2270                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2271                         best = i;
2272                 if (mod->symtab[i].st_value > addr
2273                     && mod->symtab[i].st_value < nextval
2274                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2275                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2276                         nextval = mod->symtab[i].st_value;
2277         }
2278
2279         if (!best)
2280                 return NULL;
2281
2282         if (size)
2283                 *size = nextval - mod->symtab[best].st_value;
2284         if (offset)
2285                 *offset = addr - mod->symtab[best].st_value;
2286         return mod->strtab + mod->symtab[best].st_name;
2287 }
2288
2289 /* For kallsyms to ask for address resolution.  NULL means not found.  Careful
2290  * not to lock to avoid deadlock on oopses, simply disable preemption. */
2291 const char *module_address_lookup(unsigned long addr,
2292                             unsigned long *size,
2293                             unsigned long *offset,
2294                             char **modname,
2295                             char *namebuf)
2296 {
2297         struct module *mod;
2298         const char *ret = NULL;
2299
2300         preempt_disable();
2301         list_for_each_entry(mod, &modules, list) {
2302                 if (within(addr, mod->module_init, mod->init_size)
2303                     || within(addr, mod->module_core, mod->core_size)) {
2304                         if (modname)
2305                                 *modname = mod->name;
2306                         ret = get_ksymbol(mod, addr, size, offset);
2307                         break;
2308                 }
2309         }
2310         /* Make a copy in here where it's safe */
2311         if (ret) {
2312                 strncpy(namebuf, ret, KSYM_NAME_LEN - 1);
2313                 ret = namebuf;
2314         }
2315         preempt_enable();
2316         return ret;
2317 }
2318
2319 int lookup_module_symbol_name(unsigned long addr, char *symname)
2320 {
2321         struct module *mod;
2322
2323         preempt_disable();
2324         list_for_each_entry(mod, &modules, list) {
2325                 if (within(addr, mod->module_init, mod->init_size) ||
2326                     within(addr, mod->module_core, mod->core_size)) {
2327                         const char *sym;
2328
2329                         sym = get_ksymbol(mod, addr, NULL, NULL);
2330                         if (!sym)
2331                                 goto out;
2332                         strlcpy(symname, sym, KSYM_NAME_LEN);
2333                         preempt_enable();
2334                         return 0;
2335                 }
2336         }
2337 out:
2338         preempt_enable();
2339         return -ERANGE;
2340 }
2341
2342 int lookup_module_symbol_attrs(unsigned long addr, unsigned long *size,
2343                         unsigned long *offset, char *modname, char *name)
2344 {
2345         struct module *mod;
2346
2347         preempt_disable();
2348         list_for_each_entry(mod, &modules, list) {
2349                 if (within(addr, mod->module_init, mod->init_size) ||
2350                     within(addr, mod->module_core, mod->core_size)) {
2351                         const char *sym;
2352
2353                         sym = get_ksymbol(mod, addr, size, offset);
2354                         if (!sym)
2355                                 goto out;
2356                         if (modname)
2357                                 strlcpy(modname, mod->name, MODULE_NAME_LEN);
2358                         if (name)
2359                                 strlcpy(name, sym, KSYM_NAME_LEN);
2360                         preempt_enable();
2361                         return 0;
2362                 }
2363         }
2364 out:
2365         preempt_enable();
2366         return -ERANGE;
2367 }
2368
2369 int module_get_kallsym(unsigned int symnum, unsigned long *value, char *type,
2370                         char *name, char *module_name, int *exported)
2371 {
2372         struct module *mod;
2373
2374         preempt_disable();
2375         list_for_each_entry(mod, &modules, list) {
2376                 if (symnum < mod->num_symtab) {
2377                         *value = mod->symtab[symnum].st_value;
2378                         *type = mod->symtab[symnum].st_info;
2379                         strlcpy(name, mod->strtab + mod->symtab[symnum].st_name,
2380                                 KSYM_NAME_LEN);
2381                         strlcpy(module_name, mod->name, MODULE_NAME_LEN);
2382                         *exported = is_exported(name, mod);
2383                         preempt_enable();
2384                         return 0;
2385                 }
2386                 symnum -= mod->num_symtab;
2387         }
2388         preempt_enable();
2389         return -ERANGE;
2390 }
2391
2392 static unsigned long mod_find_symname(struct module *mod, const char *name)
2393 {
2394         unsigned int i;
2395
2396         for (i = 0; i < mod->num_symtab; i++)
2397                 if (strcmp(name, mod->strtab+mod->symtab[i].st_name) == 0 &&
2398                     mod->symtab[i].st_info != 'U')
2399                         return mod->symtab[i].st_value;
2400         return 0;
2401 }
2402
2403 /* Look for this name: can be of form module:name. */
2404 unsigned long module_kallsyms_lookup_name(const char *name)
2405 {
2406         struct module *mod;
2407         char *colon;
2408         unsigned long ret = 0;
2409
2410         /* Don't lock: we're in enough trouble already. */
2411         preempt_disable();
2412         if ((colon = strchr(name, ':')) != NULL) {
2413                 *colon = '\0';
2414                 if ((mod = find_module(name)) != NULL)
2415                         ret = mod_find_symname(mod, colon+1);
2416                 *colon = ':';
2417         } else {
2418                 list_for_each_entry(mod, &modules, list)
2419                         if ((ret = mod_find_symname(mod, name)) != 0)
2420                                 break;
2421         }
2422         preempt_enable();
2423         return ret;
2424 }
2425 #endif /* CONFIG_KALLSYMS */
2426
2427 /* Called by the /proc file system to return a list of modules. */
2428 static void *m_start(struct seq_file *m, loff_t *pos)
2429 {
2430         mutex_lock(&module_mutex);
2431         return seq_list_start(&modules, *pos);
2432 }
2433
2434 static void *m_next(struct seq_file *m, void *p, loff_t *pos)
2435 {
2436         return seq_list_next(p, &modules, pos);
2437 }
2438
2439 static void m_stop(struct seq_file *m, void *p)
2440 {
2441         mutex_unlock(&module_mutex);
2442 }
2443
2444 static char *module_flags(struct module *mod, char *buf)
2445 {
2446         int bx = 0;
2447
2448         if (mod->taints ||
2449             mod->state == MODULE_STATE_GOING ||
2450             mod->state == MODULE_STATE_COMING) {
2451                 buf[bx++] = '(';
2452                 if (mod->taints & TAINT_PROPRIETARY_MODULE)
2453                         buf[bx++] = 'P';
2454                 if (mod->taints & TAINT_FORCED_MODULE)
2455                         buf[bx++] = 'F';
2456                 /*
2457                  * TAINT_FORCED_RMMOD: could be added.
2458                  * TAINT_UNSAFE_SMP, TAINT_MACHINE_CHECK, TAINT_BAD_PAGE don't
2459                  * apply to modules.
2460                  */
2461
2462                 /* Show a - for module-is-being-unloaded */
2463                 if (mod->state == MODULE_STATE_GOING)
2464                         buf[bx++] = '-';
2465                 /* Show a + for module-is-being-loaded */
2466                 if (mod->state == MODULE_STATE_COMING)
2467                         buf[bx++] = '+';
2468                 buf[bx++] = ')';
2469         }
2470         buf[bx] = '\0';
2471
2472         return buf;
2473 }
2474
2475 static int m_show(struct seq_file *m, void *p)
2476 {
2477         struct module *mod = list_entry(p, struct module, list);
2478         char buf[8];
2479
2480         seq_printf(m, "%s %lu",
2481                    mod->name, mod->init_size + mod->core_size);
2482         print_unload_info(m, mod);
2483
2484         /* Informative for users. */
2485         seq_printf(m, " %s",
2486                    mod->state == MODULE_STATE_GOING ? "Unloading":
2487                    mod->state == MODULE_STATE_COMING ? "Loading":
2488                    "Live");
2489         /* Used by oprofile and other similar tools. */
2490         seq_printf(m, " 0x%p", mod->module_core);
2491
2492         /* Taints info */
2493         if (mod->taints)
2494                 seq_printf(m, " %s", module_flags(mod, buf));
2495
2496         seq_printf(m, "\n");
2497         return 0;
2498 }
2499
2500 /* Format: modulename size refcount deps address
2501
2502    Where refcount is a number or -, and deps is a comma-separated list
2503    of depends or -.
2504 */
2505 const struct seq_operations modules_op = {
2506         .start  = m_start,
2507         .next   = m_next,
2508         .stop   = m_stop,
2509         .show   = m_show
2510 };
2511
2512 /* Given an address, look for it in the module exception tables. */
2513 const struct exception_table_entry *search_module_extables(unsigned long addr)
2514 {
2515         const struct exception_table_entry *e = NULL;
2516         struct module *mod;
2517
2518         preempt_disable();
2519         list_for_each_entry(mod, &modules, list) {
2520                 if (mod->num_exentries == 0)
2521                         continue;
2522
2523                 e = search_extable(mod->extable,
2524                                    mod->extable + mod->num_exentries - 1,
2525                                    addr);
2526                 if (e)
2527                         break;
2528         }
2529         preempt_enable();
2530
2531         /* Now, if we found one, we are running inside it now, hence
2532            we cannot unload the module, hence no refcnt needed. */
2533         return e;
2534 }
2535
2536 /*
2537  * Is this a valid module address?
2538  */
2539 int is_module_address(unsigned long addr)
2540 {
2541         struct module *mod;
2542
2543         preempt_disable();
2544
2545         list_for_each_entry(mod, &modules, list) {
2546                 if (within(addr, mod->module_core, mod->core_size)) {
2547                         preempt_enable();
2548                         return 1;
2549                 }
2550         }
2551
2552         preempt_enable();
2553
2554         return 0;
2555 }
2556
2557
2558 /* Is this a valid kernel address? */
2559 struct module *__module_text_address(unsigned long addr)
2560 {
2561         struct module *mod;
2562
2563         list_for_each_entry(mod, &modules, list)
2564                 if (within(addr, mod->module_init, mod->init_text_size)
2565                     || within(addr, mod->module_core, mod->core_text_size))
2566                         return mod;
2567         return NULL;
2568 }
2569
2570 struct module *module_text_address(unsigned long addr)
2571 {
2572         struct module *mod;
2573
2574         preempt_disable();
2575         mod = __module_text_address(addr);
2576         preempt_enable();
2577
2578         return mod;
2579 }
2580
2581 /* Don't grab lock, we're oopsing. */
2582 void print_modules(void)
2583 {
2584         struct module *mod;
2585         char buf[8];
2586
2587         printk("Modules linked in:");
2588         list_for_each_entry(mod, &modules, list)
2589                 printk(" %s%s", mod->name, module_flags(mod, buf));
2590         if (last_unloaded_module[0])
2591                 printk(" [last unloaded: %s]", last_unloaded_module);
2592         printk("\n");
2593 }
2594
2595 #ifdef CONFIG_MODVERSIONS
2596 /* Generate the signature for struct module here, too, for modversions. */
2597 void struct_module(struct module *mod) { return; }
2598 EXPORT_SYMBOL(struct_module);
2599 #endif
2600
2601 #ifdef CONFIG_MARKERS
2602 void module_update_markers(void)
2603 {
2604         struct module *mod;
2605
2606         mutex_lock(&module_mutex);
2607         list_for_each_entry(mod, &modules, list)
2608                 if (!mod->taints)
2609                         marker_update_probe_range(mod->markers,
2610                                 mod->markers + mod->num_markers);
2611         mutex_unlock(&module_mutex);
2612 }
2613 #endif