module: fix memory leak when load fails after srcversion/version allocated
[linux-2.6.git] / kernel / module.c
1 /*
2    Copyright (C) 2002 Richard Henderson
3    Copyright (C) 2001 Rusty Russell, 2002 Rusty Russell IBM.
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 */
19 #include <linux/module.h>
20 #include <linux/moduleloader.h>
21 #include <linux/ftrace_event.h>
22 #include <linux/init.h>
23 #include <linux/kallsyms.h>
24 #include <linux/fs.h>
25 #include <linux/sysfs.h>
26 #include <linux/kernel.h>
27 #include <linux/slab.h>
28 #include <linux/vmalloc.h>
29 #include <linux/elf.h>
30 #include <linux/proc_fs.h>
31 #include <linux/seq_file.h>
32 #include <linux/syscalls.h>
33 #include <linux/fcntl.h>
34 #include <linux/rcupdate.h>
35 #include <linux/capability.h>
36 #include <linux/cpu.h>
37 #include <linux/moduleparam.h>
38 #include <linux/errno.h>
39 #include <linux/err.h>
40 #include <linux/vermagic.h>
41 #include <linux/notifier.h>
42 #include <linux/sched.h>
43 #include <linux/stop_machine.h>
44 #include <linux/device.h>
45 #include <linux/string.h>
46 #include <linux/mutex.h>
47 #include <linux/rculist.h>
48 #include <asm/uaccess.h>
49 #include <asm/cacheflush.h>
50 #include <asm/mmu_context.h>
51 #include <linux/license.h>
52 #include <asm/sections.h>
53 #include <linux/tracepoint.h>
54 #include <linux/ftrace.h>
55 #include <linux/async.h>
56 #include <linux/percpu.h>
57 #include <linux/kmemleak.h>
58
59 #define CREATE_TRACE_POINTS
60 #include <trace/events/module.h>
61
62 EXPORT_TRACEPOINT_SYMBOL(module_get);
63
64 #if 0
65 #define DEBUGP printk
66 #else
67 #define DEBUGP(fmt , a...)
68 #endif
69
70 #ifndef ARCH_SHF_SMALL
71 #define ARCH_SHF_SMALL 0
72 #endif
73
74 /* If this is set, the section belongs in the init part of the module */
75 #define INIT_OFFSET_MASK (1UL << (BITS_PER_LONG-1))
76
77 /* List of modules, protected by module_mutex or preempt_disable
78  * (delete uses stop_machine/add uses RCU list operations). */
79 DEFINE_MUTEX(module_mutex);
80 EXPORT_SYMBOL_GPL(module_mutex);
81 static LIST_HEAD(modules);
82
83 /* Block module loading/unloading? */
84 int modules_disabled = 0;
85
86 /* Waiting for a module to finish initializing? */
87 static DECLARE_WAIT_QUEUE_HEAD(module_wq);
88
89 static BLOCKING_NOTIFIER_HEAD(module_notify_list);
90
91 /* Bounds of module allocation, for speeding __module_address */
92 static unsigned long module_addr_min = -1UL, module_addr_max = 0;
93
94 int register_module_notifier(struct notifier_block * nb)
95 {
96         return blocking_notifier_chain_register(&module_notify_list, nb);
97 }
98 EXPORT_SYMBOL(register_module_notifier);
99
100 int unregister_module_notifier(struct notifier_block * nb)
101 {
102         return blocking_notifier_chain_unregister(&module_notify_list, nb);
103 }
104 EXPORT_SYMBOL(unregister_module_notifier);
105
106 /* We require a truly strong try_module_get(): 0 means failure due to
107    ongoing or failed initialization etc. */
108 static inline int strong_try_module_get(struct module *mod)
109 {
110         if (mod && mod->state == MODULE_STATE_COMING)
111                 return -EBUSY;
112         if (try_module_get(mod))
113                 return 0;
114         else
115                 return -ENOENT;
116 }
117
118 static inline void add_taint_module(struct module *mod, unsigned flag)
119 {
120         add_taint(flag);
121         mod->taints |= (1U << flag);
122 }
123
124 /*
125  * A thread that wants to hold a reference to a module only while it
126  * is running can call this to safely exit.  nfsd and lockd use this.
127  */
128 void __module_put_and_exit(struct module *mod, long code)
129 {
130         module_put(mod);
131         do_exit(code);
132 }
133 EXPORT_SYMBOL(__module_put_and_exit);
134
135 /* Find a module section: 0 means not found. */
136 static unsigned int find_sec(Elf_Ehdr *hdr,
137                              Elf_Shdr *sechdrs,
138                              const char *secstrings,
139                              const char *name)
140 {
141         unsigned int i;
142
143         for (i = 1; i < hdr->e_shnum; i++)
144                 /* Alloc bit cleared means "ignore it." */
145                 if ((sechdrs[i].sh_flags & SHF_ALLOC)
146                     && strcmp(secstrings+sechdrs[i].sh_name, name) == 0)
147                         return i;
148         return 0;
149 }
150
151 /* Find a module section, or NULL. */
152 static void *section_addr(Elf_Ehdr *hdr, Elf_Shdr *shdrs,
153                           const char *secstrings, const char *name)
154 {
155         /* Section 0 has sh_addr 0. */
156         return (void *)shdrs[find_sec(hdr, shdrs, secstrings, name)].sh_addr;
157 }
158
159 /* Find a module section, or NULL.  Fill in number of "objects" in section. */
160 static void *section_objs(Elf_Ehdr *hdr,
161                           Elf_Shdr *sechdrs,
162                           const char *secstrings,
163                           const char *name,
164                           size_t object_size,
165                           unsigned int *num)
166 {
167         unsigned int sec = find_sec(hdr, sechdrs, secstrings, name);
168
169         /* Section 0 has sh_addr 0 and sh_size 0. */
170         *num = sechdrs[sec].sh_size / object_size;
171         return (void *)sechdrs[sec].sh_addr;
172 }
173
174 /* Provided by the linker */
175 extern const struct kernel_symbol __start___ksymtab[];
176 extern const struct kernel_symbol __stop___ksymtab[];
177 extern const struct kernel_symbol __start___ksymtab_gpl[];
178 extern const struct kernel_symbol __stop___ksymtab_gpl[];
179 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
180 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
181 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
182 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
183 extern const unsigned long __start___kcrctab[];
184 extern const unsigned long __start___kcrctab_gpl[];
185 extern const unsigned long __start___kcrctab_gpl_future[];
186 #ifdef CONFIG_UNUSED_SYMBOLS
187 extern const struct kernel_symbol __start___ksymtab_unused[];
188 extern const struct kernel_symbol __stop___ksymtab_unused[];
189 extern const struct kernel_symbol __start___ksymtab_unused_gpl[];
190 extern const struct kernel_symbol __stop___ksymtab_unused_gpl[];
191 extern const unsigned long __start___kcrctab_unused[];
192 extern const unsigned long __start___kcrctab_unused_gpl[];
193 #endif
194
195 #ifndef CONFIG_MODVERSIONS
196 #define symversion(base, idx) NULL
197 #else
198 #define symversion(base, idx) ((base != NULL) ? ((base) + (idx)) : NULL)
199 #endif
200
201 static bool each_symbol_in_section(const struct symsearch *arr,
202                                    unsigned int arrsize,
203                                    struct module *owner,
204                                    bool (*fn)(const struct symsearch *syms,
205                                               struct module *owner,
206                                               unsigned int symnum, void *data),
207                                    void *data)
208 {
209         unsigned int i, j;
210
211         for (j = 0; j < arrsize; j++) {
212                 for (i = 0; i < arr[j].stop - arr[j].start; i++)
213                         if (fn(&arr[j], owner, i, data))
214                                 return true;
215         }
216
217         return false;
218 }
219
220 /* Returns true as soon as fn returns true, otherwise false. */
221 bool each_symbol(bool (*fn)(const struct symsearch *arr, struct module *owner,
222                             unsigned int symnum, void *data), void *data)
223 {
224         struct module *mod;
225         const struct symsearch arr[] = {
226                 { __start___ksymtab, __stop___ksymtab, __start___kcrctab,
227                   NOT_GPL_ONLY, false },
228                 { __start___ksymtab_gpl, __stop___ksymtab_gpl,
229                   __start___kcrctab_gpl,
230                   GPL_ONLY, false },
231                 { __start___ksymtab_gpl_future, __stop___ksymtab_gpl_future,
232                   __start___kcrctab_gpl_future,
233                   WILL_BE_GPL_ONLY, false },
234 #ifdef CONFIG_UNUSED_SYMBOLS
235                 { __start___ksymtab_unused, __stop___ksymtab_unused,
236                   __start___kcrctab_unused,
237                   NOT_GPL_ONLY, true },
238                 { __start___ksymtab_unused_gpl, __stop___ksymtab_unused_gpl,
239                   __start___kcrctab_unused_gpl,
240                   GPL_ONLY, true },
241 #endif
242         };
243
244         if (each_symbol_in_section(arr, ARRAY_SIZE(arr), NULL, fn, data))
245                 return true;
246
247         list_for_each_entry_rcu(mod, &modules, list) {
248                 struct symsearch arr[] = {
249                         { mod->syms, mod->syms + mod->num_syms, mod->crcs,
250                           NOT_GPL_ONLY, false },
251                         { mod->gpl_syms, mod->gpl_syms + mod->num_gpl_syms,
252                           mod->gpl_crcs,
253                           GPL_ONLY, false },
254                         { mod->gpl_future_syms,
255                           mod->gpl_future_syms + mod->num_gpl_future_syms,
256                           mod->gpl_future_crcs,
257                           WILL_BE_GPL_ONLY, false },
258 #ifdef CONFIG_UNUSED_SYMBOLS
259                         { mod->unused_syms,
260                           mod->unused_syms + mod->num_unused_syms,
261                           mod->unused_crcs,
262                           NOT_GPL_ONLY, true },
263                         { mod->unused_gpl_syms,
264                           mod->unused_gpl_syms + mod->num_unused_gpl_syms,
265                           mod->unused_gpl_crcs,
266                           GPL_ONLY, true },
267 #endif
268                 };
269
270                 if (each_symbol_in_section(arr, ARRAY_SIZE(arr), mod, fn, data))
271                         return true;
272         }
273         return false;
274 }
275 EXPORT_SYMBOL_GPL(each_symbol);
276
277 struct find_symbol_arg {
278         /* Input */
279         const char *name;
280         bool gplok;
281         bool warn;
282
283         /* Output */
284         struct module *owner;
285         const unsigned long *crc;
286         const struct kernel_symbol *sym;
287 };
288
289 static bool find_symbol_in_section(const struct symsearch *syms,
290                                    struct module *owner,
291                                    unsigned int symnum, void *data)
292 {
293         struct find_symbol_arg *fsa = data;
294
295         if (strcmp(syms->start[symnum].name, fsa->name) != 0)
296                 return false;
297
298         if (!fsa->gplok) {
299                 if (syms->licence == GPL_ONLY)
300                         return false;
301                 if (syms->licence == WILL_BE_GPL_ONLY && fsa->warn) {
302                         printk(KERN_WARNING "Symbol %s is being used "
303                                "by a non-GPL module, which will not "
304                                "be allowed in the future\n", fsa->name);
305                         printk(KERN_WARNING "Please see the file "
306                                "Documentation/feature-removal-schedule.txt "
307                                "in the kernel source tree for more details.\n");
308                 }
309         }
310
311 #ifdef CONFIG_UNUSED_SYMBOLS
312         if (syms->unused && fsa->warn) {
313                 printk(KERN_WARNING "Symbol %s is marked as UNUSED, "
314                        "however this module is using it.\n", fsa->name);
315                 printk(KERN_WARNING
316                        "This symbol will go away in the future.\n");
317                 printk(KERN_WARNING
318                        "Please evalute if this is the right api to use and if "
319                        "it really is, submit a report the linux kernel "
320                        "mailinglist together with submitting your code for "
321                        "inclusion.\n");
322         }
323 #endif
324
325         fsa->owner = owner;
326         fsa->crc = symversion(syms->crcs, symnum);
327         fsa->sym = &syms->start[symnum];
328         return true;
329 }
330
331 /* Find a symbol and return it, along with, (optional) crc and
332  * (optional) module which owns it */
333 const struct kernel_symbol *find_symbol(const char *name,
334                                         struct module **owner,
335                                         const unsigned long **crc,
336                                         bool gplok,
337                                         bool warn)
338 {
339         struct find_symbol_arg fsa;
340
341         fsa.name = name;
342         fsa.gplok = gplok;
343         fsa.warn = warn;
344
345         if (each_symbol(find_symbol_in_section, &fsa)) {
346                 if (owner)
347                         *owner = fsa.owner;
348                 if (crc)
349                         *crc = fsa.crc;
350                 return fsa.sym;
351         }
352
353         DEBUGP("Failed to find symbol %s\n", name);
354         return NULL;
355 }
356 EXPORT_SYMBOL_GPL(find_symbol);
357
358 /* Search for module by name: must hold module_mutex. */
359 struct module *find_module(const char *name)
360 {
361         struct module *mod;
362
363         list_for_each_entry(mod, &modules, list) {
364                 if (strcmp(mod->name, name) == 0)
365                         return mod;
366         }
367         return NULL;
368 }
369 EXPORT_SYMBOL_GPL(find_module);
370
371 #ifdef CONFIG_SMP
372
373 #ifndef CONFIG_HAVE_LEGACY_PER_CPU_AREA
374
375 static void *percpu_modalloc(unsigned long size, unsigned long align,
376                              const char *name)
377 {
378         void *ptr;
379
380         if (align > PAGE_SIZE) {
381                 printk(KERN_WARNING "%s: per-cpu alignment %li > %li\n",
382                        name, align, PAGE_SIZE);
383                 align = PAGE_SIZE;
384         }
385
386         ptr = __alloc_reserved_percpu(size, align);
387         if (!ptr)
388                 printk(KERN_WARNING
389                        "Could not allocate %lu bytes percpu data\n", size);
390         return ptr;
391 }
392
393 static void percpu_modfree(void *freeme)
394 {
395         free_percpu(freeme);
396 }
397
398 #else /* ... CONFIG_HAVE_LEGACY_PER_CPU_AREA */
399
400 /* Number of blocks used and allocated. */
401 static unsigned int pcpu_num_used, pcpu_num_allocated;
402 /* Size of each block.  -ve means used. */
403 static int *pcpu_size;
404
405 static int split_block(unsigned int i, unsigned short size)
406 {
407         /* Reallocation required? */
408         if (pcpu_num_used + 1 > pcpu_num_allocated) {
409                 int *new;
410
411                 new = krealloc(pcpu_size, sizeof(new[0])*pcpu_num_allocated*2,
412                                GFP_KERNEL);
413                 if (!new)
414                         return 0;
415
416                 pcpu_num_allocated *= 2;
417                 pcpu_size = new;
418         }
419
420         /* Insert a new subblock */
421         memmove(&pcpu_size[i+1], &pcpu_size[i],
422                 sizeof(pcpu_size[0]) * (pcpu_num_used - i));
423         pcpu_num_used++;
424
425         pcpu_size[i+1] -= size;
426         pcpu_size[i] = size;
427         return 1;
428 }
429
430 static inline unsigned int block_size(int val)
431 {
432         if (val < 0)
433                 return -val;
434         return val;
435 }
436
437 static void *percpu_modalloc(unsigned long size, unsigned long align,
438                              const char *name)
439 {
440         unsigned long extra;
441         unsigned int i;
442         void *ptr;
443         int cpu;
444
445         if (align > PAGE_SIZE) {
446                 printk(KERN_WARNING "%s: per-cpu alignment %li > %li\n",
447                        name, align, PAGE_SIZE);
448                 align = PAGE_SIZE;
449         }
450
451         ptr = __per_cpu_start;
452         for (i = 0; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
453                 /* Extra for alignment requirement. */
454                 extra = ALIGN((unsigned long)ptr, align) - (unsigned long)ptr;
455                 BUG_ON(i == 0 && extra != 0);
456
457                 if (pcpu_size[i] < 0 || pcpu_size[i] < extra + size)
458                         continue;
459
460                 /* Transfer extra to previous block. */
461                 if (pcpu_size[i-1] < 0)
462                         pcpu_size[i-1] -= extra;
463                 else
464                         pcpu_size[i-1] += extra;
465                 pcpu_size[i] -= extra;
466                 ptr += extra;
467
468                 /* Split block if warranted */
469                 if (pcpu_size[i] - size > sizeof(unsigned long))
470                         if (!split_block(i, size))
471                                 return NULL;
472
473                 /* add the per-cpu scanning areas */
474                 for_each_possible_cpu(cpu)
475                         kmemleak_alloc(ptr + per_cpu_offset(cpu), size, 0,
476                                        GFP_KERNEL);
477
478                 /* Mark allocated */
479                 pcpu_size[i] = -pcpu_size[i];
480                 return ptr;
481         }
482
483         printk(KERN_WARNING "Could not allocate %lu bytes percpu data\n",
484                size);
485         return NULL;
486 }
487
488 static void percpu_modfree(void *freeme)
489 {
490         unsigned int i;
491         void *ptr = __per_cpu_start + block_size(pcpu_size[0]);
492         int cpu;
493
494         /* First entry is core kernel percpu data. */
495         for (i = 1; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
496                 if (ptr == freeme) {
497                         pcpu_size[i] = -pcpu_size[i];
498                         goto free;
499                 }
500         }
501         BUG();
502
503  free:
504         /* remove the per-cpu scanning areas */
505         for_each_possible_cpu(cpu)
506                 kmemleak_free(freeme + per_cpu_offset(cpu));
507
508         /* Merge with previous? */
509         if (pcpu_size[i-1] >= 0) {
510                 pcpu_size[i-1] += pcpu_size[i];
511                 pcpu_num_used--;
512                 memmove(&pcpu_size[i], &pcpu_size[i+1],
513                         (pcpu_num_used - i) * sizeof(pcpu_size[0]));
514                 i--;
515         }
516         /* Merge with next? */
517         if (i+1 < pcpu_num_used && pcpu_size[i+1] >= 0) {
518                 pcpu_size[i] += pcpu_size[i+1];
519                 pcpu_num_used--;
520                 memmove(&pcpu_size[i+1], &pcpu_size[i+2],
521                         (pcpu_num_used - (i+1)) * sizeof(pcpu_size[0]));
522         }
523 }
524
525 static int percpu_modinit(void)
526 {
527         pcpu_num_used = 2;
528         pcpu_num_allocated = 2;
529         pcpu_size = kmalloc(sizeof(pcpu_size[0]) * pcpu_num_allocated,
530                             GFP_KERNEL);
531         /* Static in-kernel percpu data (used). */
532         pcpu_size[0] = -(__per_cpu_end-__per_cpu_start);
533         /* Free room. */
534         pcpu_size[1] = PERCPU_ENOUGH_ROOM + pcpu_size[0];
535         if (pcpu_size[1] < 0) {
536                 printk(KERN_ERR "No per-cpu room for modules.\n");
537                 pcpu_num_used = 1;
538         }
539
540         return 0;
541 }
542 __initcall(percpu_modinit);
543
544 #endif /* CONFIG_HAVE_LEGACY_PER_CPU_AREA */
545
546 static unsigned int find_pcpusec(Elf_Ehdr *hdr,
547                                  Elf_Shdr *sechdrs,
548                                  const char *secstrings)
549 {
550         return find_sec(hdr, sechdrs, secstrings, ".data.percpu");
551 }
552
553 static void percpu_modcopy(void *pcpudest, const void *from, unsigned long size)
554 {
555         int cpu;
556
557         for_each_possible_cpu(cpu)
558                 memcpy(pcpudest + per_cpu_offset(cpu), from, size);
559 }
560
561 #else /* ... !CONFIG_SMP */
562
563 static inline void *percpu_modalloc(unsigned long size, unsigned long align,
564                                     const char *name)
565 {
566         return NULL;
567 }
568 static inline void percpu_modfree(void *pcpuptr)
569 {
570         BUG();
571 }
572 static inline unsigned int find_pcpusec(Elf_Ehdr *hdr,
573                                         Elf_Shdr *sechdrs,
574                                         const char *secstrings)
575 {
576         return 0;
577 }
578 static inline void percpu_modcopy(void *pcpudst, const void *src,
579                                   unsigned long size)
580 {
581         /* pcpusec should be 0, and size of that section should be 0. */
582         BUG_ON(size != 0);
583 }
584
585 #endif /* CONFIG_SMP */
586
587 #define MODINFO_ATTR(field)     \
588 static void setup_modinfo_##field(struct module *mod, const char *s)  \
589 {                                                                     \
590         mod->field = kstrdup(s, GFP_KERNEL);                          \
591 }                                                                     \
592 static ssize_t show_modinfo_##field(struct module_attribute *mattr,   \
593                         struct module *mod, char *buffer)             \
594 {                                                                     \
595         return sprintf(buffer, "%s\n", mod->field);                   \
596 }                                                                     \
597 static int modinfo_##field##_exists(struct module *mod)               \
598 {                                                                     \
599         return mod->field != NULL;                                    \
600 }                                                                     \
601 static void free_modinfo_##field(struct module *mod)                  \
602 {                                                                     \
603         kfree(mod->field);                                            \
604         mod->field = NULL;                                            \
605 }                                                                     \
606 static struct module_attribute modinfo_##field = {                    \
607         .attr = { .name = __stringify(field), .mode = 0444 },         \
608         .show = show_modinfo_##field,                                 \
609         .setup = setup_modinfo_##field,                               \
610         .test = modinfo_##field##_exists,                             \
611         .free = free_modinfo_##field,                                 \
612 };
613
614 MODINFO_ATTR(version);
615 MODINFO_ATTR(srcversion);
616
617 static char last_unloaded_module[MODULE_NAME_LEN+1];
618
619 #ifdef CONFIG_MODULE_UNLOAD
620 /* Init the unload section of the module. */
621 static void module_unload_init(struct module *mod)
622 {
623         int cpu;
624
625         INIT_LIST_HEAD(&mod->modules_which_use_me);
626         for_each_possible_cpu(cpu)
627                 local_set(__module_ref_addr(mod, cpu), 0);
628         /* Hold reference count during initialization. */
629         local_set(__module_ref_addr(mod, raw_smp_processor_id()), 1);
630         /* Backwards compatibility macros put refcount during init. */
631         mod->waiter = current;
632 }
633
634 /* modules using other modules */
635 struct module_use
636 {
637         struct list_head list;
638         struct module *module_which_uses;
639 };
640
641 /* Does a already use b? */
642 static int already_uses(struct module *a, struct module *b)
643 {
644         struct module_use *use;
645
646         list_for_each_entry(use, &b->modules_which_use_me, list) {
647                 if (use->module_which_uses == a) {
648                         DEBUGP("%s uses %s!\n", a->name, b->name);
649                         return 1;
650                 }
651         }
652         DEBUGP("%s does not use %s!\n", a->name, b->name);
653         return 0;
654 }
655
656 /* Module a uses b */
657 int use_module(struct module *a, struct module *b)
658 {
659         struct module_use *use;
660         int no_warn, err;
661
662         if (b == NULL || already_uses(a, b)) return 1;
663
664         /* If we're interrupted or time out, we fail. */
665         if (wait_event_interruptible_timeout(
666                     module_wq, (err = strong_try_module_get(b)) != -EBUSY,
667                     30 * HZ) <= 0) {
668                 printk("%s: gave up waiting for init of module %s.\n",
669                        a->name, b->name);
670                 return 0;
671         }
672
673         /* If strong_try_module_get() returned a different error, we fail. */
674         if (err)
675                 return 0;
676
677         DEBUGP("Allocating new usage for %s.\n", a->name);
678         use = kmalloc(sizeof(*use), GFP_ATOMIC);
679         if (!use) {
680                 printk("%s: out of memory loading\n", a->name);
681                 module_put(b);
682                 return 0;
683         }
684
685         use->module_which_uses = a;
686         list_add(&use->list, &b->modules_which_use_me);
687         no_warn = sysfs_create_link(b->holders_dir, &a->mkobj.kobj, a->name);
688         return 1;
689 }
690 EXPORT_SYMBOL_GPL(use_module);
691
692 /* Clear the unload stuff of the module. */
693 static void module_unload_free(struct module *mod)
694 {
695         struct module *i;
696
697         list_for_each_entry(i, &modules, list) {
698                 struct module_use *use;
699
700                 list_for_each_entry(use, &i->modules_which_use_me, list) {
701                         if (use->module_which_uses == mod) {
702                                 DEBUGP("%s unusing %s\n", mod->name, i->name);
703                                 module_put(i);
704                                 list_del(&use->list);
705                                 kfree(use);
706                                 sysfs_remove_link(i->holders_dir, mod->name);
707                                 /* There can be at most one match. */
708                                 break;
709                         }
710                 }
711         }
712 }
713
714 #ifdef CONFIG_MODULE_FORCE_UNLOAD
715 static inline int try_force_unload(unsigned int flags)
716 {
717         int ret = (flags & O_TRUNC);
718         if (ret)
719                 add_taint(TAINT_FORCED_RMMOD);
720         return ret;
721 }
722 #else
723 static inline int try_force_unload(unsigned int flags)
724 {
725         return 0;
726 }
727 #endif /* CONFIG_MODULE_FORCE_UNLOAD */
728
729 struct stopref
730 {
731         struct module *mod;
732         int flags;
733         int *forced;
734 };
735
736 /* Whole machine is stopped with interrupts off when this runs. */
737 static int __try_stop_module(void *_sref)
738 {
739         struct stopref *sref = _sref;
740
741         /* If it's not unused, quit unless we're forcing. */
742         if (module_refcount(sref->mod) != 0) {
743                 if (!(*sref->forced = try_force_unload(sref->flags)))
744                         return -EWOULDBLOCK;
745         }
746
747         /* Mark it as dying. */
748         sref->mod->state = MODULE_STATE_GOING;
749         return 0;
750 }
751
752 static int try_stop_module(struct module *mod, int flags, int *forced)
753 {
754         if (flags & O_NONBLOCK) {
755                 struct stopref sref = { mod, flags, forced };
756
757                 return stop_machine(__try_stop_module, &sref, NULL);
758         } else {
759                 /* We don't need to stop the machine for this. */
760                 mod->state = MODULE_STATE_GOING;
761                 synchronize_sched();
762                 return 0;
763         }
764 }
765
766 unsigned int module_refcount(struct module *mod)
767 {
768         unsigned int total = 0;
769         int cpu;
770
771         for_each_possible_cpu(cpu)
772                 total += local_read(__module_ref_addr(mod, cpu));
773         return total;
774 }
775 EXPORT_SYMBOL(module_refcount);
776
777 /* This exists whether we can unload or not */
778 static void free_module(struct module *mod);
779
780 static void wait_for_zero_refcount(struct module *mod)
781 {
782         /* Since we might sleep for some time, release the mutex first */
783         mutex_unlock(&module_mutex);
784         for (;;) {
785                 DEBUGP("Looking at refcount...\n");
786                 set_current_state(TASK_UNINTERRUPTIBLE);
787                 if (module_refcount(mod) == 0)
788                         break;
789                 schedule();
790         }
791         current->state = TASK_RUNNING;
792         mutex_lock(&module_mutex);
793 }
794
795 SYSCALL_DEFINE2(delete_module, const char __user *, name_user,
796                 unsigned int, flags)
797 {
798         struct module *mod;
799         char name[MODULE_NAME_LEN];
800         int ret, forced = 0;
801
802         if (!capable(CAP_SYS_MODULE) || modules_disabled)
803                 return -EPERM;
804
805         if (strncpy_from_user(name, name_user, MODULE_NAME_LEN-1) < 0)
806                 return -EFAULT;
807         name[MODULE_NAME_LEN-1] = '\0';
808
809         /* Create stop_machine threads since free_module relies on
810          * a non-failing stop_machine call. */
811         ret = stop_machine_create();
812         if (ret)
813                 return ret;
814
815         if (mutex_lock_interruptible(&module_mutex) != 0) {
816                 ret = -EINTR;
817                 goto out_stop;
818         }
819
820         mod = find_module(name);
821         if (!mod) {
822                 ret = -ENOENT;
823                 goto out;
824         }
825
826         if (!list_empty(&mod->modules_which_use_me)) {
827                 /* Other modules depend on us: get rid of them first. */
828                 ret = -EWOULDBLOCK;
829                 goto out;
830         }
831
832         /* Doing init or already dying? */
833         if (mod->state != MODULE_STATE_LIVE) {
834                 /* FIXME: if (force), slam module count and wake up
835                    waiter --RR */
836                 DEBUGP("%s already dying\n", mod->name);
837                 ret = -EBUSY;
838                 goto out;
839         }
840
841         /* If it has an init func, it must have an exit func to unload */
842         if (mod->init && !mod->exit) {
843                 forced = try_force_unload(flags);
844                 if (!forced) {
845                         /* This module can't be removed */
846                         ret = -EBUSY;
847                         goto out;
848                 }
849         }
850
851         /* Set this up before setting mod->state */
852         mod->waiter = current;
853
854         /* Stop the machine so refcounts can't move and disable module. */
855         ret = try_stop_module(mod, flags, &forced);
856         if (ret != 0)
857                 goto out;
858
859         /* Never wait if forced. */
860         if (!forced && module_refcount(mod) != 0)
861                 wait_for_zero_refcount(mod);
862
863         mutex_unlock(&module_mutex);
864         /* Final destruction now noone is using it. */
865         if (mod->exit != NULL)
866                 mod->exit();
867         blocking_notifier_call_chain(&module_notify_list,
868                                      MODULE_STATE_GOING, mod);
869         async_synchronize_full();
870         mutex_lock(&module_mutex);
871         /* Store the name of the last unloaded module for diagnostic purposes */
872         strlcpy(last_unloaded_module, mod->name, sizeof(last_unloaded_module));
873         ddebug_remove_module(mod->name);
874         free_module(mod);
875
876  out:
877         mutex_unlock(&module_mutex);
878 out_stop:
879         stop_machine_destroy();
880         return ret;
881 }
882
883 static inline void print_unload_info(struct seq_file *m, struct module *mod)
884 {
885         struct module_use *use;
886         int printed_something = 0;
887
888         seq_printf(m, " %u ", module_refcount(mod));
889
890         /* Always include a trailing , so userspace can differentiate
891            between this and the old multi-field proc format. */
892         list_for_each_entry(use, &mod->modules_which_use_me, list) {
893                 printed_something = 1;
894                 seq_printf(m, "%s,", use->module_which_uses->name);
895         }
896
897         if (mod->init != NULL && mod->exit == NULL) {
898                 printed_something = 1;
899                 seq_printf(m, "[permanent],");
900         }
901
902         if (!printed_something)
903                 seq_printf(m, "-");
904 }
905
906 void __symbol_put(const char *symbol)
907 {
908         struct module *owner;
909
910         preempt_disable();
911         if (!find_symbol(symbol, &owner, NULL, true, false))
912                 BUG();
913         module_put(owner);
914         preempt_enable();
915 }
916 EXPORT_SYMBOL(__symbol_put);
917
918 /* Note this assumes addr is a function, which it currently always is. */
919 void symbol_put_addr(void *addr)
920 {
921         struct module *modaddr;
922         unsigned long a = (unsigned long)dereference_function_descriptor(addr);
923
924         if (core_kernel_text(a))
925                 return;
926
927         /* module_text_address is safe here: we're supposed to have reference
928          * to module from symbol_get, so it can't go away. */
929         modaddr = __module_text_address(a);
930         BUG_ON(!modaddr);
931         module_put(modaddr);
932 }
933 EXPORT_SYMBOL_GPL(symbol_put_addr);
934
935 static ssize_t show_refcnt(struct module_attribute *mattr,
936                            struct module *mod, char *buffer)
937 {
938         return sprintf(buffer, "%u\n", module_refcount(mod));
939 }
940
941 static struct module_attribute refcnt = {
942         .attr = { .name = "refcnt", .mode = 0444 },
943         .show = show_refcnt,
944 };
945
946 void module_put(struct module *module)
947 {
948         if (module) {
949                 unsigned int cpu = get_cpu();
950                 local_dec(__module_ref_addr(module, cpu));
951                 trace_module_put(module, _RET_IP_,
952                                  local_read(__module_ref_addr(module, cpu)));
953                 /* Maybe they're waiting for us to drop reference? */
954                 if (unlikely(!module_is_live(module)))
955                         wake_up_process(module->waiter);
956                 put_cpu();
957         }
958 }
959 EXPORT_SYMBOL(module_put);
960
961 #else /* !CONFIG_MODULE_UNLOAD */
962 static inline void print_unload_info(struct seq_file *m, struct module *mod)
963 {
964         /* We don't know the usage count, or what modules are using. */
965         seq_printf(m, " - -");
966 }
967
968 static inline void module_unload_free(struct module *mod)
969 {
970 }
971
972 int use_module(struct module *a, struct module *b)
973 {
974         return strong_try_module_get(b) == 0;
975 }
976 EXPORT_SYMBOL_GPL(use_module);
977
978 static inline void module_unload_init(struct module *mod)
979 {
980 }
981 #endif /* CONFIG_MODULE_UNLOAD */
982
983 static ssize_t show_initstate(struct module_attribute *mattr,
984                            struct module *mod, char *buffer)
985 {
986         const char *state = "unknown";
987
988         switch (mod->state) {
989         case MODULE_STATE_LIVE:
990                 state = "live";
991                 break;
992         case MODULE_STATE_COMING:
993                 state = "coming";
994                 break;
995         case MODULE_STATE_GOING:
996                 state = "going";
997                 break;
998         }
999         return sprintf(buffer, "%s\n", state);
1000 }
1001
1002 static struct module_attribute initstate = {
1003         .attr = { .name = "initstate", .mode = 0444 },
1004         .show = show_initstate,
1005 };
1006
1007 static struct module_attribute *modinfo_attrs[] = {
1008         &modinfo_version,
1009         &modinfo_srcversion,
1010         &initstate,
1011 #ifdef CONFIG_MODULE_UNLOAD
1012         &refcnt,
1013 #endif
1014         NULL,
1015 };
1016
1017 static const char vermagic[] = VERMAGIC_STRING;
1018
1019 static int try_to_force_load(struct module *mod, const char *reason)
1020 {
1021 #ifdef CONFIG_MODULE_FORCE_LOAD
1022         if (!test_taint(TAINT_FORCED_MODULE))
1023                 printk(KERN_WARNING "%s: %s: kernel tainted.\n",
1024                        mod->name, reason);
1025         add_taint_module(mod, TAINT_FORCED_MODULE);
1026         return 0;
1027 #else
1028         return -ENOEXEC;
1029 #endif
1030 }
1031
1032 #ifdef CONFIG_MODVERSIONS
1033 static int check_version(Elf_Shdr *sechdrs,
1034                          unsigned int versindex,
1035                          const char *symname,
1036                          struct module *mod, 
1037                          const unsigned long *crc)
1038 {
1039         unsigned int i, num_versions;
1040         struct modversion_info *versions;
1041
1042         /* Exporting module didn't supply crcs?  OK, we're already tainted. */
1043         if (!crc)
1044                 return 1;
1045
1046         /* No versions at all?  modprobe --force does this. */
1047         if (versindex == 0)
1048                 return try_to_force_load(mod, symname) == 0;
1049
1050         versions = (void *) sechdrs[versindex].sh_addr;
1051         num_versions = sechdrs[versindex].sh_size
1052                 / sizeof(struct modversion_info);
1053
1054         for (i = 0; i < num_versions; i++) {
1055                 if (strcmp(versions[i].name, symname) != 0)
1056                         continue;
1057
1058                 if (versions[i].crc == *crc)
1059                         return 1;
1060                 DEBUGP("Found checksum %lX vs module %lX\n",
1061                        *crc, versions[i].crc);
1062                 goto bad_version;
1063         }
1064
1065         printk(KERN_WARNING "%s: no symbol version for %s\n",
1066                mod->name, symname);
1067         return 0;
1068
1069 bad_version:
1070         printk("%s: disagrees about version of symbol %s\n",
1071                mod->name, symname);
1072         return 0;
1073 }
1074
1075 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
1076                                           unsigned int versindex,
1077                                           struct module *mod)
1078 {
1079         const unsigned long *crc;
1080
1081         if (!find_symbol(MODULE_SYMBOL_PREFIX "module_layout", NULL,
1082                          &crc, true, false))
1083                 BUG();
1084         return check_version(sechdrs, versindex, "module_layout", mod, crc);
1085 }
1086
1087 /* First part is kernel version, which we ignore if module has crcs. */
1088 static inline int same_magic(const char *amagic, const char *bmagic,
1089                              bool has_crcs)
1090 {
1091         if (has_crcs) {
1092                 amagic += strcspn(amagic, " ");
1093                 bmagic += strcspn(bmagic, " ");
1094         }
1095         return strcmp(amagic, bmagic) == 0;
1096 }
1097 #else
1098 static inline int check_version(Elf_Shdr *sechdrs,
1099                                 unsigned int versindex,
1100                                 const char *symname,
1101                                 struct module *mod, 
1102                                 const unsigned long *crc)
1103 {
1104         return 1;
1105 }
1106
1107 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
1108                                           unsigned int versindex,
1109                                           struct module *mod)
1110 {
1111         return 1;
1112 }
1113
1114 static inline int same_magic(const char *amagic, const char *bmagic,
1115                              bool has_crcs)
1116 {
1117         return strcmp(amagic, bmagic) == 0;
1118 }
1119 #endif /* CONFIG_MODVERSIONS */
1120
1121 /* Resolve a symbol for this module.  I.e. if we find one, record usage.
1122    Must be holding module_mutex. */
1123 static const struct kernel_symbol *resolve_symbol(Elf_Shdr *sechdrs,
1124                                                   unsigned int versindex,
1125                                                   const char *name,
1126                                                   struct module *mod)
1127 {
1128         struct module *owner;
1129         const struct kernel_symbol *sym;
1130         const unsigned long *crc;
1131
1132         sym = find_symbol(name, &owner, &crc,
1133                           !(mod->taints & (1 << TAINT_PROPRIETARY_MODULE)), true);
1134         /* use_module can fail due to OOM,
1135            or module initialization or unloading */
1136         if (sym) {
1137                 if (!check_version(sechdrs, versindex, name, mod, crc) ||
1138                     !use_module(mod, owner))
1139                         sym = NULL;
1140         }
1141         return sym;
1142 }
1143
1144 /*
1145  * /sys/module/foo/sections stuff
1146  * J. Corbet <corbet@lwn.net>
1147  */
1148 #if defined(CONFIG_KALLSYMS) && defined(CONFIG_SYSFS)
1149 struct module_sect_attr
1150 {
1151         struct module_attribute mattr;
1152         char *name;
1153         unsigned long address;
1154 };
1155
1156 struct module_sect_attrs
1157 {
1158         struct attribute_group grp;
1159         unsigned int nsections;
1160         struct module_sect_attr attrs[0];
1161 };
1162
1163 static ssize_t module_sect_show(struct module_attribute *mattr,
1164                                 struct module *mod, char *buf)
1165 {
1166         struct module_sect_attr *sattr =
1167                 container_of(mattr, struct module_sect_attr, mattr);
1168         return sprintf(buf, "0x%lx\n", sattr->address);
1169 }
1170
1171 static void free_sect_attrs(struct module_sect_attrs *sect_attrs)
1172 {
1173         unsigned int section;
1174
1175         for (section = 0; section < sect_attrs->nsections; section++)
1176                 kfree(sect_attrs->attrs[section].name);
1177         kfree(sect_attrs);
1178 }
1179
1180 static void add_sect_attrs(struct module *mod, unsigned int nsect,
1181                 char *secstrings, Elf_Shdr *sechdrs)
1182 {
1183         unsigned int nloaded = 0, i, size[2];
1184         struct module_sect_attrs *sect_attrs;
1185         struct module_sect_attr *sattr;
1186         struct attribute **gattr;
1187
1188         /* Count loaded sections and allocate structures */
1189         for (i = 0; i < nsect; i++)
1190                 if (sechdrs[i].sh_flags & SHF_ALLOC)
1191                         nloaded++;
1192         size[0] = ALIGN(sizeof(*sect_attrs)
1193                         + nloaded * sizeof(sect_attrs->attrs[0]),
1194                         sizeof(sect_attrs->grp.attrs[0]));
1195         size[1] = (nloaded + 1) * sizeof(sect_attrs->grp.attrs[0]);
1196         sect_attrs = kzalloc(size[0] + size[1], GFP_KERNEL);
1197         if (sect_attrs == NULL)
1198                 return;
1199
1200         /* Setup section attributes. */
1201         sect_attrs->grp.name = "sections";
1202         sect_attrs->grp.attrs = (void *)sect_attrs + size[0];
1203
1204         sect_attrs->nsections = 0;
1205         sattr = &sect_attrs->attrs[0];
1206         gattr = &sect_attrs->grp.attrs[0];
1207         for (i = 0; i < nsect; i++) {
1208                 if (! (sechdrs[i].sh_flags & SHF_ALLOC))
1209                         continue;
1210                 sattr->address = sechdrs[i].sh_addr;
1211                 sattr->name = kstrdup(secstrings + sechdrs[i].sh_name,
1212                                         GFP_KERNEL);
1213                 if (sattr->name == NULL)
1214                         goto out;
1215                 sect_attrs->nsections++;
1216                 sattr->mattr.show = module_sect_show;
1217                 sattr->mattr.store = NULL;
1218                 sattr->mattr.attr.name = sattr->name;
1219                 sattr->mattr.attr.mode = S_IRUGO;
1220                 *(gattr++) = &(sattr++)->mattr.attr;
1221         }
1222         *gattr = NULL;
1223
1224         if (sysfs_create_group(&mod->mkobj.kobj, &sect_attrs->grp))
1225                 goto out;
1226
1227         mod->sect_attrs = sect_attrs;
1228         return;
1229   out:
1230         free_sect_attrs(sect_attrs);
1231 }
1232
1233 static void remove_sect_attrs(struct module *mod)
1234 {
1235         if (mod->sect_attrs) {
1236                 sysfs_remove_group(&mod->mkobj.kobj,
1237                                    &mod->sect_attrs->grp);
1238                 /* We are positive that no one is using any sect attrs
1239                  * at this point.  Deallocate immediately. */
1240                 free_sect_attrs(mod->sect_attrs);
1241                 mod->sect_attrs = NULL;
1242         }
1243 }
1244
1245 /*
1246  * /sys/module/foo/notes/.section.name gives contents of SHT_NOTE sections.
1247  */
1248
1249 struct module_notes_attrs {
1250         struct kobject *dir;
1251         unsigned int notes;
1252         struct bin_attribute attrs[0];
1253 };
1254
1255 static ssize_t module_notes_read(struct kobject *kobj,
1256                                  struct bin_attribute *bin_attr,
1257                                  char *buf, loff_t pos, size_t count)
1258 {
1259         /*
1260          * The caller checked the pos and count against our size.
1261          */
1262         memcpy(buf, bin_attr->private + pos, count);
1263         return count;
1264 }
1265
1266 static void free_notes_attrs(struct module_notes_attrs *notes_attrs,
1267                              unsigned int i)
1268 {
1269         if (notes_attrs->dir) {
1270                 while (i-- > 0)
1271                         sysfs_remove_bin_file(notes_attrs->dir,
1272                                               &notes_attrs->attrs[i]);
1273                 kobject_put(notes_attrs->dir);
1274         }
1275         kfree(notes_attrs);
1276 }
1277
1278 static void add_notes_attrs(struct module *mod, unsigned int nsect,
1279                             char *secstrings, Elf_Shdr *sechdrs)
1280 {
1281         unsigned int notes, loaded, i;
1282         struct module_notes_attrs *notes_attrs;
1283         struct bin_attribute *nattr;
1284
1285         /* failed to create section attributes, so can't create notes */
1286         if (!mod->sect_attrs)
1287                 return;
1288
1289         /* Count notes sections and allocate structures.  */
1290         notes = 0;
1291         for (i = 0; i < nsect; i++)
1292                 if ((sechdrs[i].sh_flags & SHF_ALLOC) &&
1293                     (sechdrs[i].sh_type == SHT_NOTE))
1294                         ++notes;
1295
1296         if (notes == 0)
1297                 return;
1298
1299         notes_attrs = kzalloc(sizeof(*notes_attrs)
1300                               + notes * sizeof(notes_attrs->attrs[0]),
1301                               GFP_KERNEL);
1302         if (notes_attrs == NULL)
1303                 return;
1304
1305         notes_attrs->notes = notes;
1306         nattr = &notes_attrs->attrs[0];
1307         for (loaded = i = 0; i < nsect; ++i) {
1308                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1309                         continue;
1310                 if (sechdrs[i].sh_type == SHT_NOTE) {
1311                         nattr->attr.name = mod->sect_attrs->attrs[loaded].name;
1312                         nattr->attr.mode = S_IRUGO;
1313                         nattr->size = sechdrs[i].sh_size;
1314                         nattr->private = (void *) sechdrs[i].sh_addr;
1315                         nattr->read = module_notes_read;
1316                         ++nattr;
1317                 }
1318                 ++loaded;
1319         }
1320
1321         notes_attrs->dir = kobject_create_and_add("notes", &mod->mkobj.kobj);
1322         if (!notes_attrs->dir)
1323                 goto out;
1324
1325         for (i = 0; i < notes; ++i)
1326                 if (sysfs_create_bin_file(notes_attrs->dir,
1327                                           &notes_attrs->attrs[i]))
1328                         goto out;
1329
1330         mod->notes_attrs = notes_attrs;
1331         return;
1332
1333   out:
1334         free_notes_attrs(notes_attrs, i);
1335 }
1336
1337 static void remove_notes_attrs(struct module *mod)
1338 {
1339         if (mod->notes_attrs)
1340                 free_notes_attrs(mod->notes_attrs, mod->notes_attrs->notes);
1341 }
1342
1343 #else
1344
1345 static inline void add_sect_attrs(struct module *mod, unsigned int nsect,
1346                 char *sectstrings, Elf_Shdr *sechdrs)
1347 {
1348 }
1349
1350 static inline void remove_sect_attrs(struct module *mod)
1351 {
1352 }
1353
1354 static inline void add_notes_attrs(struct module *mod, unsigned int nsect,
1355                                    char *sectstrings, Elf_Shdr *sechdrs)
1356 {
1357 }
1358
1359 static inline void remove_notes_attrs(struct module *mod)
1360 {
1361 }
1362 #endif
1363
1364 #ifdef CONFIG_SYSFS
1365 int module_add_modinfo_attrs(struct module *mod)
1366 {
1367         struct module_attribute *attr;
1368         struct module_attribute *temp_attr;
1369         int error = 0;
1370         int i;
1371
1372         mod->modinfo_attrs = kzalloc((sizeof(struct module_attribute) *
1373                                         (ARRAY_SIZE(modinfo_attrs) + 1)),
1374                                         GFP_KERNEL);
1375         if (!mod->modinfo_attrs)
1376                 return -ENOMEM;
1377
1378         temp_attr = mod->modinfo_attrs;
1379         for (i = 0; (attr = modinfo_attrs[i]) && !error; i++) {
1380                 if (!attr->test ||
1381                     (attr->test && attr->test(mod))) {
1382                         memcpy(temp_attr, attr, sizeof(*temp_attr));
1383                         error = sysfs_create_file(&mod->mkobj.kobj,&temp_attr->attr);
1384                         ++temp_attr;
1385                 }
1386         }
1387         return error;
1388 }
1389
1390 void module_remove_modinfo_attrs(struct module *mod)
1391 {
1392         struct module_attribute *attr;
1393         int i;
1394
1395         for (i = 0; (attr = &mod->modinfo_attrs[i]); i++) {
1396                 /* pick a field to test for end of list */
1397                 if (!attr->attr.name)
1398                         break;
1399                 sysfs_remove_file(&mod->mkobj.kobj,&attr->attr);
1400                 if (attr->free)
1401                         attr->free(mod);
1402         }
1403         kfree(mod->modinfo_attrs);
1404 }
1405
1406 int mod_sysfs_init(struct module *mod)
1407 {
1408         int err;
1409         struct kobject *kobj;
1410
1411         if (!module_sysfs_initialized) {
1412                 printk(KERN_ERR "%s: module sysfs not initialized\n",
1413                        mod->name);
1414                 err = -EINVAL;
1415                 goto out;
1416         }
1417
1418         kobj = kset_find_obj(module_kset, mod->name);
1419         if (kobj) {
1420                 printk(KERN_ERR "%s: module is already loaded\n", mod->name);
1421                 kobject_put(kobj);
1422                 err = -EINVAL;
1423                 goto out;
1424         }
1425
1426         mod->mkobj.mod = mod;
1427
1428         memset(&mod->mkobj.kobj, 0, sizeof(mod->mkobj.kobj));
1429         mod->mkobj.kobj.kset = module_kset;
1430         err = kobject_init_and_add(&mod->mkobj.kobj, &module_ktype, NULL,
1431                                    "%s", mod->name);
1432         if (err)
1433                 kobject_put(&mod->mkobj.kobj);
1434
1435         /* delay uevent until full sysfs population */
1436 out:
1437         return err;
1438 }
1439
1440 int mod_sysfs_setup(struct module *mod,
1441                            struct kernel_param *kparam,
1442                            unsigned int num_params)
1443 {
1444         int err;
1445
1446         mod->holders_dir = kobject_create_and_add("holders", &mod->mkobj.kobj);
1447         if (!mod->holders_dir) {
1448                 err = -ENOMEM;
1449                 goto out_unreg;
1450         }
1451
1452         err = module_param_sysfs_setup(mod, kparam, num_params);
1453         if (err)
1454                 goto out_unreg_holders;
1455
1456         err = module_add_modinfo_attrs(mod);
1457         if (err)
1458                 goto out_unreg_param;
1459
1460         kobject_uevent(&mod->mkobj.kobj, KOBJ_ADD);
1461         return 0;
1462
1463 out_unreg_param:
1464         module_param_sysfs_remove(mod);
1465 out_unreg_holders:
1466         kobject_put(mod->holders_dir);
1467 out_unreg:
1468         kobject_put(&mod->mkobj.kobj);
1469         return err;
1470 }
1471
1472 static void mod_sysfs_fini(struct module *mod)
1473 {
1474         kobject_put(&mod->mkobj.kobj);
1475 }
1476
1477 #else /* CONFIG_SYSFS */
1478
1479 static void mod_sysfs_fini(struct module *mod)
1480 {
1481 }
1482
1483 #endif /* CONFIG_SYSFS */
1484
1485 static void mod_kobject_remove(struct module *mod)
1486 {
1487         module_remove_modinfo_attrs(mod);
1488         module_param_sysfs_remove(mod);
1489         kobject_put(mod->mkobj.drivers_dir);
1490         kobject_put(mod->holders_dir);
1491         mod_sysfs_fini(mod);
1492 }
1493
1494 /*
1495  * unlink the module with the whole machine is stopped with interrupts off
1496  * - this defends against kallsyms not taking locks
1497  */
1498 static int __unlink_module(void *_mod)
1499 {
1500         struct module *mod = _mod;
1501         list_del(&mod->list);
1502         return 0;
1503 }
1504
1505 /* Free a module, remove from lists, etc (must hold module_mutex). */
1506 static void free_module(struct module *mod)
1507 {
1508         trace_module_free(mod);
1509
1510         /* Delete from various lists */
1511         stop_machine(__unlink_module, mod, NULL);
1512         remove_notes_attrs(mod);
1513         remove_sect_attrs(mod);
1514         mod_kobject_remove(mod);
1515
1516         /* Arch-specific cleanup. */
1517         module_arch_cleanup(mod);
1518
1519         /* Module unload stuff */
1520         module_unload_free(mod);
1521
1522         /* Free any allocated parameters. */
1523         destroy_params(mod->kp, mod->num_kp);
1524
1525         /* This may be NULL, but that's OK */
1526         module_free(mod, mod->module_init);
1527         kfree(mod->args);
1528         if (mod->percpu)
1529                 percpu_modfree(mod->percpu);
1530 #if defined(CONFIG_MODULE_UNLOAD) && defined(CONFIG_SMP)
1531         if (mod->refptr)
1532                 percpu_modfree(mod->refptr);
1533 #endif
1534         /* Free lock-classes: */
1535         lockdep_free_key_range(mod->module_core, mod->core_size);
1536
1537         /* Finally, free the core (containing the module structure) */
1538         module_free(mod, mod->module_core);
1539
1540 #ifdef CONFIG_MPU
1541         update_protections(current->mm);
1542 #endif
1543 }
1544
1545 void *__symbol_get(const char *symbol)
1546 {
1547         struct module *owner;
1548         const struct kernel_symbol *sym;
1549
1550         preempt_disable();
1551         sym = find_symbol(symbol, &owner, NULL, true, true);
1552         if (sym && strong_try_module_get(owner))
1553                 sym = NULL;
1554         preempt_enable();
1555
1556         return sym ? (void *)sym->value : NULL;
1557 }
1558 EXPORT_SYMBOL_GPL(__symbol_get);
1559
1560 /*
1561  * Ensure that an exported symbol [global namespace] does not already exist
1562  * in the kernel or in some other module's exported symbol table.
1563  */
1564 static int verify_export_symbols(struct module *mod)
1565 {
1566         unsigned int i;
1567         struct module *owner;
1568         const struct kernel_symbol *s;
1569         struct {
1570                 const struct kernel_symbol *sym;
1571                 unsigned int num;
1572         } arr[] = {
1573                 { mod->syms, mod->num_syms },
1574                 { mod->gpl_syms, mod->num_gpl_syms },
1575                 { mod->gpl_future_syms, mod->num_gpl_future_syms },
1576 #ifdef CONFIG_UNUSED_SYMBOLS
1577                 { mod->unused_syms, mod->num_unused_syms },
1578                 { mod->unused_gpl_syms, mod->num_unused_gpl_syms },
1579 #endif
1580         };
1581
1582         for (i = 0; i < ARRAY_SIZE(arr); i++) {
1583                 for (s = arr[i].sym; s < arr[i].sym + arr[i].num; s++) {
1584                         if (find_symbol(s->name, &owner, NULL, true, false)) {
1585                                 printk(KERN_ERR
1586                                        "%s: exports duplicate symbol %s"
1587                                        " (owned by %s)\n",
1588                                        mod->name, s->name, module_name(owner));
1589                                 return -ENOEXEC;
1590                         }
1591                 }
1592         }
1593         return 0;
1594 }
1595
1596 /* Change all symbols so that st_value encodes the pointer directly. */
1597 static int simplify_symbols(Elf_Shdr *sechdrs,
1598                             unsigned int symindex,
1599                             const char *strtab,
1600                             unsigned int versindex,
1601                             unsigned int pcpuindex,
1602                             struct module *mod)
1603 {
1604         Elf_Sym *sym = (void *)sechdrs[symindex].sh_addr;
1605         unsigned long secbase;
1606         unsigned int i, n = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1607         int ret = 0;
1608         const struct kernel_symbol *ksym;
1609
1610         for (i = 1; i < n; i++) {
1611                 switch (sym[i].st_shndx) {
1612                 case SHN_COMMON:
1613                         /* We compiled with -fno-common.  These are not
1614                            supposed to happen.  */
1615                         DEBUGP("Common symbol: %s\n", strtab + sym[i].st_name);
1616                         printk("%s: please compile with -fno-common\n",
1617                                mod->name);
1618                         ret = -ENOEXEC;
1619                         break;
1620
1621                 case SHN_ABS:
1622                         /* Don't need to do anything */
1623                         DEBUGP("Absolute symbol: 0x%08lx\n",
1624                                (long)sym[i].st_value);
1625                         break;
1626
1627                 case SHN_UNDEF:
1628                         ksym = resolve_symbol(sechdrs, versindex,
1629                                               strtab + sym[i].st_name, mod);
1630                         /* Ok if resolved.  */
1631                         if (ksym) {
1632                                 sym[i].st_value = ksym->value;
1633                                 break;
1634                         }
1635
1636                         /* Ok if weak.  */
1637                         if (ELF_ST_BIND(sym[i].st_info) == STB_WEAK)
1638                                 break;
1639
1640                         printk(KERN_WARNING "%s: Unknown symbol %s\n",
1641                                mod->name, strtab + sym[i].st_name);
1642                         ret = -ENOENT;
1643                         break;
1644
1645                 default:
1646                         /* Divert to percpu allocation if a percpu var. */
1647                         if (sym[i].st_shndx == pcpuindex)
1648                                 secbase = (unsigned long)mod->percpu;
1649                         else
1650                                 secbase = sechdrs[sym[i].st_shndx].sh_addr;
1651                         sym[i].st_value += secbase;
1652                         break;
1653                 }
1654         }
1655
1656         return ret;
1657 }
1658
1659 /* Additional bytes needed by arch in front of individual sections */
1660 unsigned int __weak arch_mod_section_prepend(struct module *mod,
1661                                              unsigned int section)
1662 {
1663         /* default implementation just returns zero */
1664         return 0;
1665 }
1666
1667 /* Update size with this section: return offset. */
1668 static long get_offset(struct module *mod, unsigned int *size,
1669                        Elf_Shdr *sechdr, unsigned int section)
1670 {
1671         long ret;
1672
1673         *size += arch_mod_section_prepend(mod, section);
1674         ret = ALIGN(*size, sechdr->sh_addralign ?: 1);
1675         *size = ret + sechdr->sh_size;
1676         return ret;
1677 }
1678
1679 /* Lay out the SHF_ALLOC sections in a way not dissimilar to how ld
1680    might -- code, read-only data, read-write data, small data.  Tally
1681    sizes, and place the offsets into sh_entsize fields: high bit means it
1682    belongs in init. */
1683 static void layout_sections(struct module *mod,
1684                             const Elf_Ehdr *hdr,
1685                             Elf_Shdr *sechdrs,
1686                             const char *secstrings)
1687 {
1688         static unsigned long const masks[][2] = {
1689                 /* NOTE: all executable code must be the first section
1690                  * in this array; otherwise modify the text_size
1691                  * finder in the two loops below */
1692                 { SHF_EXECINSTR | SHF_ALLOC, ARCH_SHF_SMALL },
1693                 { SHF_ALLOC, SHF_WRITE | ARCH_SHF_SMALL },
1694                 { SHF_WRITE | SHF_ALLOC, ARCH_SHF_SMALL },
1695                 { ARCH_SHF_SMALL | SHF_ALLOC, 0 }
1696         };
1697         unsigned int m, i;
1698
1699         for (i = 0; i < hdr->e_shnum; i++)
1700                 sechdrs[i].sh_entsize = ~0UL;
1701
1702         DEBUGP("Core section allocation order:\n");
1703         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1704                 for (i = 0; i < hdr->e_shnum; ++i) {
1705                         Elf_Shdr *s = &sechdrs[i];
1706
1707                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1708                             || (s->sh_flags & masks[m][1])
1709                             || s->sh_entsize != ~0UL
1710                             || strstarts(secstrings + s->sh_name, ".init"))
1711                                 continue;
1712                         s->sh_entsize = get_offset(mod, &mod->core_size, s, i);
1713                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1714                 }
1715                 if (m == 0)
1716                         mod->core_text_size = mod->core_size;
1717         }
1718
1719         DEBUGP("Init section allocation order:\n");
1720         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1721                 for (i = 0; i < hdr->e_shnum; ++i) {
1722                         Elf_Shdr *s = &sechdrs[i];
1723
1724                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1725                             || (s->sh_flags & masks[m][1])
1726                             || s->sh_entsize != ~0UL
1727                             || !strstarts(secstrings + s->sh_name, ".init"))
1728                                 continue;
1729                         s->sh_entsize = (get_offset(mod, &mod->init_size, s, i)
1730                                          | INIT_OFFSET_MASK);
1731                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1732                 }
1733                 if (m == 0)
1734                         mod->init_text_size = mod->init_size;
1735         }
1736 }
1737
1738 static void set_license(struct module *mod, const char *license)
1739 {
1740         if (!license)
1741                 license = "unspecified";
1742
1743         if (!license_is_gpl_compatible(license)) {
1744                 if (!test_taint(TAINT_PROPRIETARY_MODULE))
1745                         printk(KERN_WARNING "%s: module license '%s' taints "
1746                                 "kernel.\n", mod->name, license);
1747                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1748         }
1749 }
1750
1751 /* Parse tag=value strings from .modinfo section */
1752 static char *next_string(char *string, unsigned long *secsize)
1753 {
1754         /* Skip non-zero chars */
1755         while (string[0]) {
1756                 string++;
1757                 if ((*secsize)-- <= 1)
1758                         return NULL;
1759         }
1760
1761         /* Skip any zero padding. */
1762         while (!string[0]) {
1763                 string++;
1764                 if ((*secsize)-- <= 1)
1765                         return NULL;
1766         }
1767         return string;
1768 }
1769
1770 static char *get_modinfo(Elf_Shdr *sechdrs,
1771                          unsigned int info,
1772                          const char *tag)
1773 {
1774         char *p;
1775         unsigned int taglen = strlen(tag);
1776         unsigned long size = sechdrs[info].sh_size;
1777
1778         for (p = (char *)sechdrs[info].sh_addr; p; p = next_string(p, &size)) {
1779                 if (strncmp(p, tag, taglen) == 0 && p[taglen] == '=')
1780                         return p + taglen + 1;
1781         }
1782         return NULL;
1783 }
1784
1785 static void setup_modinfo(struct module *mod, Elf_Shdr *sechdrs,
1786                           unsigned int infoindex)
1787 {
1788         struct module_attribute *attr;
1789         int i;
1790
1791         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1792                 if (attr->setup)
1793                         attr->setup(mod,
1794                                     get_modinfo(sechdrs,
1795                                                 infoindex,
1796                                                 attr->attr.name));
1797         }
1798 }
1799
1800 static void free_modinfo(struct module *mod)
1801 {
1802         struct module_attribute *attr;
1803         int i;
1804
1805         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1806                 if (attr->free)
1807                         attr->free(mod);
1808         }
1809 }
1810
1811 #ifdef CONFIG_KALLSYMS
1812
1813 /* lookup symbol in given range of kernel_symbols */
1814 static const struct kernel_symbol *lookup_symbol(const char *name,
1815         const struct kernel_symbol *start,
1816         const struct kernel_symbol *stop)
1817 {
1818         const struct kernel_symbol *ks = start;
1819         for (; ks < stop; ks++)
1820                 if (strcmp(ks->name, name) == 0)
1821                         return ks;
1822         return NULL;
1823 }
1824
1825 static int is_exported(const char *name, unsigned long value,
1826                        const struct module *mod)
1827 {
1828         const struct kernel_symbol *ks;
1829         if (!mod)
1830                 ks = lookup_symbol(name, __start___ksymtab, __stop___ksymtab);
1831         else
1832                 ks = lookup_symbol(name, mod->syms, mod->syms + mod->num_syms);
1833         return ks != NULL && ks->value == value;
1834 }
1835
1836 /* As per nm */
1837 static char elf_type(const Elf_Sym *sym,
1838                      Elf_Shdr *sechdrs,
1839                      const char *secstrings,
1840                      struct module *mod)
1841 {
1842         if (ELF_ST_BIND(sym->st_info) == STB_WEAK) {
1843                 if (ELF_ST_TYPE(sym->st_info) == STT_OBJECT)
1844                         return 'v';
1845                 else
1846                         return 'w';
1847         }
1848         if (sym->st_shndx == SHN_UNDEF)
1849                 return 'U';
1850         if (sym->st_shndx == SHN_ABS)
1851                 return 'a';
1852         if (sym->st_shndx >= SHN_LORESERVE)
1853                 return '?';
1854         if (sechdrs[sym->st_shndx].sh_flags & SHF_EXECINSTR)
1855                 return 't';
1856         if (sechdrs[sym->st_shndx].sh_flags & SHF_ALLOC
1857             && sechdrs[sym->st_shndx].sh_type != SHT_NOBITS) {
1858                 if (!(sechdrs[sym->st_shndx].sh_flags & SHF_WRITE))
1859                         return 'r';
1860                 else if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1861                         return 'g';
1862                 else
1863                         return 'd';
1864         }
1865         if (sechdrs[sym->st_shndx].sh_type == SHT_NOBITS) {
1866                 if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1867                         return 's';
1868                 else
1869                         return 'b';
1870         }
1871         if (strstarts(secstrings + sechdrs[sym->st_shndx].sh_name, ".debug"))
1872                 return 'n';
1873         return '?';
1874 }
1875
1876 static bool is_core_symbol(const Elf_Sym *src, const Elf_Shdr *sechdrs,
1877                            unsigned int shnum)
1878 {
1879         const Elf_Shdr *sec;
1880
1881         if (src->st_shndx == SHN_UNDEF
1882             || src->st_shndx >= shnum
1883             || !src->st_name)
1884                 return false;
1885
1886         sec = sechdrs + src->st_shndx;
1887         if (!(sec->sh_flags & SHF_ALLOC)
1888 #ifndef CONFIG_KALLSYMS_ALL
1889             || !(sec->sh_flags & SHF_EXECINSTR)
1890 #endif
1891             || (sec->sh_entsize & INIT_OFFSET_MASK))
1892                 return false;
1893
1894         return true;
1895 }
1896
1897 static unsigned long layout_symtab(struct module *mod,
1898                                    Elf_Shdr *sechdrs,
1899                                    unsigned int symindex,
1900                                    unsigned int strindex,
1901                                    const Elf_Ehdr *hdr,
1902                                    const char *secstrings,
1903                                    unsigned long *pstroffs,
1904                                    unsigned long *strmap)
1905 {
1906         unsigned long symoffs;
1907         Elf_Shdr *symsect = sechdrs + symindex;
1908         Elf_Shdr *strsect = sechdrs + strindex;
1909         const Elf_Sym *src;
1910         const char *strtab;
1911         unsigned int i, nsrc, ndst;
1912
1913         /* Put symbol section at end of init part of module. */
1914         symsect->sh_flags |= SHF_ALLOC;
1915         symsect->sh_entsize = get_offset(mod, &mod->init_size, symsect,
1916                                          symindex) | INIT_OFFSET_MASK;
1917         DEBUGP("\t%s\n", secstrings + symsect->sh_name);
1918
1919         src = (void *)hdr + symsect->sh_offset;
1920         nsrc = symsect->sh_size / sizeof(*src);
1921         strtab = (void *)hdr + strsect->sh_offset;
1922         for (ndst = i = 1; i < nsrc; ++i, ++src)
1923                 if (is_core_symbol(src, sechdrs, hdr->e_shnum)) {
1924                         unsigned int j = src->st_name;
1925
1926                         while(!__test_and_set_bit(j, strmap) && strtab[j])
1927                                 ++j;
1928                         ++ndst;
1929                 }
1930
1931         /* Append room for core symbols at end of core part. */
1932         symoffs = ALIGN(mod->core_size, symsect->sh_addralign ?: 1);
1933         mod->core_size = symoffs + ndst * sizeof(Elf_Sym);
1934
1935         /* Put string table section at end of init part of module. */
1936         strsect->sh_flags |= SHF_ALLOC;
1937         strsect->sh_entsize = get_offset(mod, &mod->init_size, strsect,
1938                                          strindex) | INIT_OFFSET_MASK;
1939         DEBUGP("\t%s\n", secstrings + strsect->sh_name);
1940
1941         /* Append room for core symbols' strings at end of core part. */
1942         *pstroffs = mod->core_size;
1943         __set_bit(0, strmap);
1944         mod->core_size += bitmap_weight(strmap, strsect->sh_size);
1945
1946         return symoffs;
1947 }
1948
1949 static void add_kallsyms(struct module *mod,
1950                          Elf_Shdr *sechdrs,
1951                          unsigned int shnum,
1952                          unsigned int symindex,
1953                          unsigned int strindex,
1954                          unsigned long symoffs,
1955                          unsigned long stroffs,
1956                          const char *secstrings,
1957                          unsigned long *strmap)
1958 {
1959         unsigned int i, ndst;
1960         const Elf_Sym *src;
1961         Elf_Sym *dst;
1962         char *s;
1963
1964         mod->symtab = (void *)sechdrs[symindex].sh_addr;
1965         mod->num_symtab = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1966         mod->strtab = (void *)sechdrs[strindex].sh_addr;
1967
1968         /* Set types up while we still have access to sections. */
1969         for (i = 0; i < mod->num_symtab; i++)
1970                 mod->symtab[i].st_info
1971                         = elf_type(&mod->symtab[i], sechdrs, secstrings, mod);
1972
1973         mod->core_symtab = dst = mod->module_core + symoffs;
1974         src = mod->symtab;
1975         *dst = *src;
1976         for (ndst = i = 1; i < mod->num_symtab; ++i, ++src) {
1977                 if (!is_core_symbol(src, sechdrs, shnum))
1978                         continue;
1979                 dst[ndst] = *src;
1980                 dst[ndst].st_name = bitmap_weight(strmap, dst[ndst].st_name);
1981                 ++ndst;
1982         }
1983         mod->core_num_syms = ndst;
1984
1985         mod->core_strtab = s = mod->module_core + stroffs;
1986         for (*s = 0, i = 1; i < sechdrs[strindex].sh_size; ++i)
1987                 if (test_bit(i, strmap))
1988                         *++s = mod->strtab[i];
1989 }
1990 #else
1991 static inline unsigned long layout_symtab(struct module *mod,
1992                                           Elf_Shdr *sechdrs,
1993                                           unsigned int symindex,
1994                                           unsigned int strindex,
1995                                           const Elf_Hdr *hdr,
1996                                           const char *secstrings,
1997                                           unsigned long *pstroffs,
1998                                           unsigned long *strmap)
1999 {
2000 }
2001 static inline void add_kallsyms(struct module *mod,
2002                                 Elf_Shdr *sechdrs,
2003                                 unsigned int shnum,
2004                                 unsigned int symindex,
2005                                 unsigned int strindex,
2006                                 unsigned long symoffs,
2007                                 unsigned long stroffs,
2008                                 const char *secstrings,
2009                                 const unsigned long *strmap)
2010 {
2011 }
2012 #endif /* CONFIG_KALLSYMS */
2013
2014 static void dynamic_debug_setup(struct _ddebug *debug, unsigned int num)
2015 {
2016 #ifdef CONFIG_DYNAMIC_DEBUG
2017         if (ddebug_add_module(debug, num, debug->modname))
2018                 printk(KERN_ERR "dynamic debug error adding module: %s\n",
2019                                         debug->modname);
2020 #endif
2021 }
2022
2023 static void *module_alloc_update_bounds(unsigned long size)
2024 {
2025         void *ret = module_alloc(size);
2026
2027         if (ret) {
2028                 /* Update module bounds. */
2029                 if ((unsigned long)ret < module_addr_min)
2030                         module_addr_min = (unsigned long)ret;
2031                 if ((unsigned long)ret + size > module_addr_max)
2032                         module_addr_max = (unsigned long)ret + size;
2033         }
2034         return ret;
2035 }
2036
2037 #ifdef CONFIG_DEBUG_KMEMLEAK
2038 static void kmemleak_load_module(struct module *mod, Elf_Ehdr *hdr,
2039                                  Elf_Shdr *sechdrs, char *secstrings)
2040 {
2041         unsigned int i;
2042
2043         /* only scan the sections containing data */
2044         kmemleak_scan_area(mod->module_core, (unsigned long)mod -
2045                            (unsigned long)mod->module_core,
2046                            sizeof(struct module), GFP_KERNEL);
2047
2048         for (i = 1; i < hdr->e_shnum; i++) {
2049                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
2050                         continue;
2051                 if (strncmp(secstrings + sechdrs[i].sh_name, ".data", 5) != 0
2052                     && strncmp(secstrings + sechdrs[i].sh_name, ".bss", 4) != 0)
2053                         continue;
2054
2055                 kmemleak_scan_area(mod->module_core, sechdrs[i].sh_addr -
2056                                    (unsigned long)mod->module_core,
2057                                    sechdrs[i].sh_size, GFP_KERNEL);
2058         }
2059 }
2060 #else
2061 static inline void kmemleak_load_module(struct module *mod, Elf_Ehdr *hdr,
2062                                         Elf_Shdr *sechdrs, char *secstrings)
2063 {
2064 }
2065 #endif
2066
2067 /* Allocate and load the module: note that size of section 0 is always
2068    zero, and we rely on this for optional sections. */
2069 static noinline struct module *load_module(void __user *umod,
2070                                   unsigned long len,
2071                                   const char __user *uargs)
2072 {
2073         Elf_Ehdr *hdr;
2074         Elf_Shdr *sechdrs;
2075         char *secstrings, *args, *modmagic, *strtab = NULL;
2076         char *staging;
2077         unsigned int i;
2078         unsigned int symindex = 0;
2079         unsigned int strindex = 0;
2080         unsigned int modindex, versindex, infoindex, pcpuindex;
2081         struct module *mod;
2082         long err = 0;
2083         void *percpu = NULL, *ptr = NULL; /* Stops spurious gcc warning */
2084 #ifdef CONFIG_KALLSYMS
2085         unsigned long symoffs, stroffs, *strmap;
2086 #endif
2087         mm_segment_t old_fs;
2088
2089         DEBUGP("load_module: umod=%p, len=%lu, uargs=%p\n",
2090                umod, len, uargs);
2091         if (len < sizeof(*hdr))
2092                 return ERR_PTR(-ENOEXEC);
2093
2094         /* Suck in entire file: we'll want most of it. */
2095         /* vmalloc barfs on "unusual" numbers.  Check here */
2096         if (len > 64 * 1024 * 1024 || (hdr = vmalloc(len)) == NULL)
2097                 return ERR_PTR(-ENOMEM);
2098
2099         if (copy_from_user(hdr, umod, len) != 0) {
2100                 err = -EFAULT;
2101                 goto free_hdr;
2102         }
2103
2104         /* Sanity checks against insmoding binaries or wrong arch,
2105            weird elf version */
2106         if (memcmp(hdr->e_ident, ELFMAG, SELFMAG) != 0
2107             || hdr->e_type != ET_REL
2108             || !elf_check_arch(hdr)
2109             || hdr->e_shentsize != sizeof(*sechdrs)) {
2110                 err = -ENOEXEC;
2111                 goto free_hdr;
2112         }
2113
2114         if (len < hdr->e_shoff + hdr->e_shnum * sizeof(Elf_Shdr))
2115                 goto truncated;
2116
2117         /* Convenience variables */
2118         sechdrs = (void *)hdr + hdr->e_shoff;
2119         secstrings = (void *)hdr + sechdrs[hdr->e_shstrndx].sh_offset;
2120         sechdrs[0].sh_addr = 0;
2121
2122         for (i = 1; i < hdr->e_shnum; i++) {
2123                 if (sechdrs[i].sh_type != SHT_NOBITS
2124                     && len < sechdrs[i].sh_offset + sechdrs[i].sh_size)
2125                         goto truncated;
2126
2127                 /* Mark all sections sh_addr with their address in the
2128                    temporary image. */
2129                 sechdrs[i].sh_addr = (size_t)hdr + sechdrs[i].sh_offset;
2130
2131                 /* Internal symbols and strings. */
2132                 if (sechdrs[i].sh_type == SHT_SYMTAB) {
2133                         symindex = i;
2134                         strindex = sechdrs[i].sh_link;
2135                         strtab = (char *)hdr + sechdrs[strindex].sh_offset;
2136                 }
2137 #ifndef CONFIG_MODULE_UNLOAD
2138                 /* Don't load .exit sections */
2139                 if (strstarts(secstrings+sechdrs[i].sh_name, ".exit"))
2140                         sechdrs[i].sh_flags &= ~(unsigned long)SHF_ALLOC;
2141 #endif
2142         }
2143
2144         modindex = find_sec(hdr, sechdrs, secstrings,
2145                             ".gnu.linkonce.this_module");
2146         if (!modindex) {
2147                 printk(KERN_WARNING "No module found in object\n");
2148                 err = -ENOEXEC;
2149                 goto free_hdr;
2150         }
2151         /* This is temporary: point mod into copy of data. */
2152         mod = (void *)sechdrs[modindex].sh_addr;
2153
2154         if (symindex == 0) {
2155                 printk(KERN_WARNING "%s: module has no symbols (stripped?)\n",
2156                        mod->name);
2157                 err = -ENOEXEC;
2158                 goto free_hdr;
2159         }
2160
2161         versindex = find_sec(hdr, sechdrs, secstrings, "__versions");
2162         infoindex = find_sec(hdr, sechdrs, secstrings, ".modinfo");
2163         pcpuindex = find_pcpusec(hdr, sechdrs, secstrings);
2164
2165         /* Don't keep modinfo and version sections. */
2166         sechdrs[infoindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
2167         sechdrs[versindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
2168
2169         /* Check module struct version now, before we try to use module. */
2170         if (!check_modstruct_version(sechdrs, versindex, mod)) {
2171                 err = -ENOEXEC;
2172                 goto free_hdr;
2173         }
2174
2175         modmagic = get_modinfo(sechdrs, infoindex, "vermagic");
2176         /* This is allowed: modprobe --force will invalidate it. */
2177         if (!modmagic) {
2178                 err = try_to_force_load(mod, "bad vermagic");
2179                 if (err)
2180                         goto free_hdr;
2181         } else if (!same_magic(modmagic, vermagic, versindex)) {
2182                 printk(KERN_ERR "%s: version magic '%s' should be '%s'\n",
2183                        mod->name, modmagic, vermagic);
2184                 err = -ENOEXEC;
2185                 goto free_hdr;
2186         }
2187
2188         staging = get_modinfo(sechdrs, infoindex, "staging");
2189         if (staging) {
2190                 add_taint_module(mod, TAINT_CRAP);
2191                 printk(KERN_WARNING "%s: module is from the staging directory,"
2192                        " the quality is unknown, you have been warned.\n",
2193                        mod->name);
2194         }
2195
2196         /* Now copy in args */
2197         args = strndup_user(uargs, ~0UL >> 1);
2198         if (IS_ERR(args)) {
2199                 err = PTR_ERR(args);
2200                 goto free_hdr;
2201         }
2202
2203         strmap = kzalloc(BITS_TO_LONGS(sechdrs[strindex].sh_size)
2204                          * sizeof(long), GFP_KERNEL);
2205         if (!strmap) {
2206                 err = -ENOMEM;
2207                 goto free_mod;
2208         }
2209
2210         if (find_module(mod->name)) {
2211                 err = -EEXIST;
2212                 goto free_mod;
2213         }
2214
2215         mod->state = MODULE_STATE_COMING;
2216
2217         /* Allow arches to frob section contents and sizes.  */
2218         err = module_frob_arch_sections(hdr, sechdrs, secstrings, mod);
2219         if (err < 0)
2220                 goto free_mod;
2221
2222         if (pcpuindex) {
2223                 /* We have a special allocation for this section. */
2224                 percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
2225                                          sechdrs[pcpuindex].sh_addralign,
2226                                          mod->name);
2227                 if (!percpu) {
2228                         err = -ENOMEM;
2229                         goto free_mod;
2230                 }
2231                 sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
2232                 mod->percpu = percpu;
2233         }
2234
2235         /* Determine total sizes, and put offsets in sh_entsize.  For now
2236            this is done generically; there doesn't appear to be any
2237            special cases for the architectures. */
2238         layout_sections(mod, hdr, sechdrs, secstrings);
2239         symoffs = layout_symtab(mod, sechdrs, symindex, strindex, hdr,
2240                                 secstrings, &stroffs, strmap);
2241
2242         /* Do the allocs. */
2243         ptr = module_alloc_update_bounds(mod->core_size);
2244         /*
2245          * The pointer to this block is stored in the module structure
2246          * which is inside the block. Just mark it as not being a
2247          * leak.
2248          */
2249         kmemleak_not_leak(ptr);
2250         if (!ptr) {
2251                 err = -ENOMEM;
2252                 goto free_percpu;
2253         }
2254         memset(ptr, 0, mod->core_size);
2255         mod->module_core = ptr;
2256
2257         ptr = module_alloc_update_bounds(mod->init_size);
2258         /*
2259          * The pointer to this block is stored in the module structure
2260          * which is inside the block. This block doesn't need to be
2261          * scanned as it contains data and code that will be freed
2262          * after the module is initialized.
2263          */
2264         kmemleak_ignore(ptr);
2265         if (!ptr && mod->init_size) {
2266                 err = -ENOMEM;
2267                 goto free_core;
2268         }
2269         memset(ptr, 0, mod->init_size);
2270         mod->module_init = ptr;
2271
2272         /* Transfer each section which specifies SHF_ALLOC */
2273         DEBUGP("final section addresses:\n");
2274         for (i = 0; i < hdr->e_shnum; i++) {
2275                 void *dest;
2276
2277                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
2278                         continue;
2279
2280                 if (sechdrs[i].sh_entsize & INIT_OFFSET_MASK)
2281                         dest = mod->module_init
2282                                 + (sechdrs[i].sh_entsize & ~INIT_OFFSET_MASK);
2283                 else
2284                         dest = mod->module_core + sechdrs[i].sh_entsize;
2285
2286                 if (sechdrs[i].sh_type != SHT_NOBITS)
2287                         memcpy(dest, (void *)sechdrs[i].sh_addr,
2288                                sechdrs[i].sh_size);
2289                 /* Update sh_addr to point to copy in image. */
2290                 sechdrs[i].sh_addr = (unsigned long)dest;
2291                 DEBUGP("\t0x%lx %s\n", sechdrs[i].sh_addr, secstrings + sechdrs[i].sh_name);
2292         }
2293         /* Module has been moved. */
2294         mod = (void *)sechdrs[modindex].sh_addr;
2295         kmemleak_load_module(mod, hdr, sechdrs, secstrings);
2296
2297 #if defined(CONFIG_MODULE_UNLOAD) && defined(CONFIG_SMP)
2298         mod->refptr = percpu_modalloc(sizeof(local_t), __alignof__(local_t),
2299                                       mod->name);
2300         if (!mod->refptr) {
2301                 err = -ENOMEM;
2302                 goto free_init;
2303         }
2304 #endif
2305         /* Now we've moved module, initialize linked lists, etc. */
2306         module_unload_init(mod);
2307
2308         /* add kobject, so we can reference it. */
2309         err = mod_sysfs_init(mod);
2310         if (err)
2311                 goto free_unload;
2312
2313         /* Set up license info based on the info section */
2314         set_license(mod, get_modinfo(sechdrs, infoindex, "license"));
2315
2316         /*
2317          * ndiswrapper is under GPL by itself, but loads proprietary modules.
2318          * Don't use add_taint_module(), as it would prevent ndiswrapper from
2319          * using GPL-only symbols it needs.
2320          */
2321         if (strcmp(mod->name, "ndiswrapper") == 0)
2322                 add_taint(TAINT_PROPRIETARY_MODULE);
2323
2324         /* driverloader was caught wrongly pretending to be under GPL */
2325         if (strcmp(mod->name, "driverloader") == 0)
2326                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
2327
2328         /* Set up MODINFO_ATTR fields */
2329         setup_modinfo(mod, sechdrs, infoindex);
2330
2331         /* Fix up syms, so that st_value is a pointer to location. */
2332         err = simplify_symbols(sechdrs, symindex, strtab, versindex, pcpuindex,
2333                                mod);
2334         if (err < 0)
2335                 goto cleanup;
2336
2337         /* Now we've got everything in the final locations, we can
2338          * find optional sections. */
2339         mod->kp = section_objs(hdr, sechdrs, secstrings, "__param",
2340                                sizeof(*mod->kp), &mod->num_kp);
2341         mod->syms = section_objs(hdr, sechdrs, secstrings, "__ksymtab",
2342                                  sizeof(*mod->syms), &mod->num_syms);
2343         mod->crcs = section_addr(hdr, sechdrs, secstrings, "__kcrctab");
2344         mod->gpl_syms = section_objs(hdr, sechdrs, secstrings, "__ksymtab_gpl",
2345                                      sizeof(*mod->gpl_syms),
2346                                      &mod->num_gpl_syms);
2347         mod->gpl_crcs = section_addr(hdr, sechdrs, secstrings, "__kcrctab_gpl");
2348         mod->gpl_future_syms = section_objs(hdr, sechdrs, secstrings,
2349                                             "__ksymtab_gpl_future",
2350                                             sizeof(*mod->gpl_future_syms),
2351                                             &mod->num_gpl_future_syms);
2352         mod->gpl_future_crcs = section_addr(hdr, sechdrs, secstrings,
2353                                             "__kcrctab_gpl_future");
2354
2355 #ifdef CONFIG_UNUSED_SYMBOLS
2356         mod->unused_syms = section_objs(hdr, sechdrs, secstrings,
2357                                         "__ksymtab_unused",
2358                                         sizeof(*mod->unused_syms),
2359                                         &mod->num_unused_syms);
2360         mod->unused_crcs = section_addr(hdr, sechdrs, secstrings,
2361                                         "__kcrctab_unused");
2362         mod->unused_gpl_syms = section_objs(hdr, sechdrs, secstrings,
2363                                             "__ksymtab_unused_gpl",
2364                                             sizeof(*mod->unused_gpl_syms),
2365                                             &mod->num_unused_gpl_syms);
2366         mod->unused_gpl_crcs = section_addr(hdr, sechdrs, secstrings,
2367                                             "__kcrctab_unused_gpl");
2368 #endif
2369 #ifdef CONFIG_CONSTRUCTORS
2370         mod->ctors = section_objs(hdr, sechdrs, secstrings, ".ctors",
2371                                   sizeof(*mod->ctors), &mod->num_ctors);
2372 #endif
2373
2374 #ifdef CONFIG_TRACEPOINTS
2375         mod->tracepoints = section_objs(hdr, sechdrs, secstrings,
2376                                         "__tracepoints",
2377                                         sizeof(*mod->tracepoints),
2378                                         &mod->num_tracepoints);
2379 #endif
2380 #ifdef CONFIG_EVENT_TRACING
2381         mod->trace_events = section_objs(hdr, sechdrs, secstrings,
2382                                          "_ftrace_events",
2383                                          sizeof(*mod->trace_events),
2384                                          &mod->num_trace_events);
2385 #endif
2386 #ifdef CONFIG_FTRACE_MCOUNT_RECORD
2387         /* sechdrs[0].sh_size is always zero */
2388         mod->ftrace_callsites = section_objs(hdr, sechdrs, secstrings,
2389                                              "__mcount_loc",
2390                                              sizeof(*mod->ftrace_callsites),
2391                                              &mod->num_ftrace_callsites);
2392 #endif
2393 #ifdef CONFIG_MODVERSIONS
2394         if ((mod->num_syms && !mod->crcs)
2395             || (mod->num_gpl_syms && !mod->gpl_crcs)
2396             || (mod->num_gpl_future_syms && !mod->gpl_future_crcs)
2397 #ifdef CONFIG_UNUSED_SYMBOLS
2398             || (mod->num_unused_syms && !mod->unused_crcs)
2399             || (mod->num_unused_gpl_syms && !mod->unused_gpl_crcs)
2400 #endif
2401                 ) {
2402                 err = try_to_force_load(mod,
2403                                         "no versions for exported symbols");
2404                 if (err)
2405                         goto cleanup;
2406         }
2407 #endif
2408
2409         /* Now do relocations. */
2410         for (i = 1; i < hdr->e_shnum; i++) {
2411                 const char *strtab = (char *)sechdrs[strindex].sh_addr;
2412                 unsigned int info = sechdrs[i].sh_info;
2413
2414                 /* Not a valid relocation section? */
2415                 if (info >= hdr->e_shnum)
2416                         continue;
2417
2418                 /* Don't bother with non-allocated sections */
2419                 if (!(sechdrs[info].sh_flags & SHF_ALLOC))
2420                         continue;
2421
2422                 if (sechdrs[i].sh_type == SHT_REL)
2423                         err = apply_relocate(sechdrs, strtab, symindex, i,mod);
2424                 else if (sechdrs[i].sh_type == SHT_RELA)
2425                         err = apply_relocate_add(sechdrs, strtab, symindex, i,
2426                                                  mod);
2427                 if (err < 0)
2428                         goto cleanup;
2429         }
2430
2431         /* Find duplicate symbols */
2432         err = verify_export_symbols(mod);
2433         if (err < 0)
2434                 goto cleanup;
2435
2436         /* Set up and sort exception table */
2437         mod->extable = section_objs(hdr, sechdrs, secstrings, "__ex_table",
2438                                     sizeof(*mod->extable), &mod->num_exentries);
2439         sort_extable(mod->extable, mod->extable + mod->num_exentries);
2440
2441         /* Finally, copy percpu area over. */
2442         percpu_modcopy(mod->percpu, (void *)sechdrs[pcpuindex].sh_addr,
2443                        sechdrs[pcpuindex].sh_size);
2444
2445         add_kallsyms(mod, sechdrs, hdr->e_shnum, symindex, strindex,
2446                      symoffs, stroffs, secstrings, strmap);
2447         kfree(strmap);
2448         strmap = NULL;
2449
2450         if (!mod->taints) {
2451                 struct _ddebug *debug;
2452                 unsigned int num_debug;
2453
2454                 debug = section_objs(hdr, sechdrs, secstrings, "__verbose",
2455                                      sizeof(*debug), &num_debug);
2456                 if (debug)
2457                         dynamic_debug_setup(debug, num_debug);
2458         }
2459
2460         err = module_finalize(hdr, sechdrs, mod);
2461         if (err < 0)
2462                 goto cleanup;
2463
2464         /* flush the icache in correct context */
2465         old_fs = get_fs();
2466         set_fs(KERNEL_DS);
2467
2468         /*
2469          * Flush the instruction cache, since we've played with text.
2470          * Do it before processing of module parameters, so the module
2471          * can provide parameter accessor functions of its own.
2472          */
2473         if (mod->module_init)
2474                 flush_icache_range((unsigned long)mod->module_init,
2475                                    (unsigned long)mod->module_init
2476                                    + mod->init_size);
2477         flush_icache_range((unsigned long)mod->module_core,
2478                            (unsigned long)mod->module_core + mod->core_size);
2479
2480         set_fs(old_fs);
2481
2482         mod->args = args;
2483         if (section_addr(hdr, sechdrs, secstrings, "__obsparm"))
2484                 printk(KERN_WARNING "%s: Ignoring obsolete parameters\n",
2485                        mod->name);
2486
2487         /* Now sew it into the lists so we can get lockdep and oops
2488          * info during argument parsing.  Noone should access us, since
2489          * strong_try_module_get() will fail.
2490          * lockdep/oops can run asynchronous, so use the RCU list insertion
2491          * function to insert in a way safe to concurrent readers.
2492          * The mutex protects against concurrent writers.
2493          */
2494         list_add_rcu(&mod->list, &modules);
2495
2496         err = parse_args(mod->name, mod->args, mod->kp, mod->num_kp, NULL);
2497         if (err < 0)
2498                 goto unlink;
2499
2500         err = mod_sysfs_setup(mod, mod->kp, mod->num_kp);
2501         if (err < 0)
2502                 goto unlink;
2503         add_sect_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2504         add_notes_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
2505
2506         /* Get rid of temporary copy */
2507         vfree(hdr);
2508
2509         trace_module_load(mod);
2510
2511         /* Done! */
2512         return mod;
2513
2514  unlink:
2515         /* Unlink carefully: kallsyms could be walking list. */
2516         list_del_rcu(&mod->list);
2517         synchronize_sched();
2518         module_arch_cleanup(mod);
2519  cleanup:
2520         free_modinfo(mod);
2521         kobject_del(&mod->mkobj.kobj);
2522         kobject_put(&mod->mkobj.kobj);
2523  free_unload:
2524         module_unload_free(mod);
2525 #if defined(CONFIG_MODULE_UNLOAD) && defined(CONFIG_SMP)
2526  free_init:
2527         percpu_modfree(mod->refptr);
2528 #endif
2529         module_free(mod, mod->module_init);
2530  free_core:
2531         module_free(mod, mod->module_core);
2532         /* mod will be freed with core. Don't access it beyond this line! */
2533  free_percpu:
2534         if (percpu)
2535                 percpu_modfree(percpu);
2536  free_mod:
2537         kfree(args);
2538         kfree(strmap);
2539  free_hdr:
2540         vfree(hdr);
2541         return ERR_PTR(err);
2542
2543  truncated:
2544         printk(KERN_ERR "Module len %lu truncated\n", len);
2545         err = -ENOEXEC;
2546         goto free_hdr;
2547 }
2548
2549 /* Call module constructors. */
2550 static void do_mod_ctors(struct module *mod)
2551 {
2552 #ifdef CONFIG_CONSTRUCTORS
2553         unsigned long i;
2554
2555         for (i = 0; i < mod->num_ctors; i++)
2556                 mod->ctors[i]();
2557 #endif
2558 }
2559
2560 /* This is where the real work happens */
2561 SYSCALL_DEFINE3(init_module, void __user *, umod,
2562                 unsigned long, len, const char __user *, uargs)
2563 {
2564         struct module *mod;
2565         int ret = 0;
2566
2567         /* Must have permission */
2568         if (!capable(CAP_SYS_MODULE) || modules_disabled)
2569                 return -EPERM;
2570
2571         /* Only one module load at a time, please */
2572         if (mutex_lock_interruptible(&module_mutex) != 0)
2573                 return -EINTR;
2574
2575         /* Do all the hard work */
2576         mod = load_module(umod, len, uargs);
2577         if (IS_ERR(mod)) {
2578                 mutex_unlock(&module_mutex);
2579                 return PTR_ERR(mod);
2580         }
2581
2582         /* Drop lock so they can recurse */
2583         mutex_unlock(&module_mutex);
2584
2585         blocking_notifier_call_chain(&module_notify_list,
2586                         MODULE_STATE_COMING, mod);
2587
2588         do_mod_ctors(mod);
2589         /* Start the module */
2590         if (mod->init != NULL)
2591                 ret = do_one_initcall(mod->init);
2592         if (ret < 0) {
2593                 /* Init routine failed: abort.  Try to protect us from
2594                    buggy refcounters. */
2595                 mod->state = MODULE_STATE_GOING;
2596                 synchronize_sched();
2597                 module_put(mod);
2598                 blocking_notifier_call_chain(&module_notify_list,
2599                                              MODULE_STATE_GOING, mod);
2600                 mutex_lock(&module_mutex);
2601                 free_module(mod);
2602                 mutex_unlock(&module_mutex);
2603                 wake_up(&module_wq);
2604                 return ret;
2605         }
2606         if (ret > 0) {
2607                 printk(KERN_WARNING
2608 "%s: '%s'->init suspiciously returned %d, it should follow 0/-E convention\n"
2609 "%s: loading module anyway...\n",
2610                        __func__, mod->name, ret,
2611                        __func__);
2612                 dump_stack();
2613         }
2614
2615         /* Now it's a first class citizen!  Wake up anyone waiting for it. */
2616         mod->state = MODULE_STATE_LIVE;
2617         wake_up(&module_wq);
2618         blocking_notifier_call_chain(&module_notify_list,
2619                                      MODULE_STATE_LIVE, mod);
2620
2621         /* We need to finish all async code before the module init sequence is done */
2622         async_synchronize_full();
2623
2624         mutex_lock(&module_mutex);
2625         /* Drop initial reference. */
2626         module_put(mod);
2627         trim_init_extable(mod);
2628 #ifdef CONFIG_KALLSYMS
2629         mod->num_symtab = mod->core_num_syms;
2630         mod->symtab = mod->core_symtab;
2631         mod->strtab = mod->core_strtab;
2632 #endif
2633         module_free(mod, mod->module_init);
2634         mod->module_init = NULL;
2635         mod->init_size = 0;
2636         mod->init_text_size = 0;
2637         mutex_unlock(&module_mutex);
2638
2639         return 0;
2640 }
2641
2642 static inline int within(unsigned long addr, void *start, unsigned long size)
2643 {
2644         return ((void *)addr >= start && (void *)addr < start + size);
2645 }
2646
2647 #ifdef CONFIG_KALLSYMS
2648 /*
2649  * This ignores the intensely annoying "mapping symbols" found
2650  * in ARM ELF files: $a, $t and $d.
2651  */
2652 static inline int is_arm_mapping_symbol(const char *str)
2653 {
2654         return str[0] == '$' && strchr("atd", str[1])
2655                && (str[2] == '\0' || str[2] == '.');
2656 }
2657
2658 static const char *get_ksymbol(struct module *mod,
2659                                unsigned long addr,
2660                                unsigned long *size,
2661                                unsigned long *offset)
2662 {
2663         unsigned int i, best = 0;
2664         unsigned long nextval;
2665
2666         /* At worse, next value is at end of module */
2667         if (within_module_init(addr, mod))
2668                 nextval = (unsigned long)mod->module_init+mod->init_text_size;
2669         else
2670                 nextval = (unsigned long)mod->module_core+mod->core_text_size;
2671
2672         /* Scan for closest preceeding symbol, and next symbol. (ELF
2673            starts real symbols at 1). */
2674         for (i = 1; i < mod->num_symtab; i++) {
2675                 if (mod->symtab[i].st_shndx == SHN_UNDEF)
2676                         continue;
2677
2678                 /* We ignore unnamed symbols: they're uninformative
2679                  * and inserted at a whim. */
2680                 if (mod->symtab[i].st_value <= addr
2681                     && mod->symtab[i].st_value > mod->symtab[best].st_value
2682                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2683                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2684                         best = i;
2685                 if (mod->symtab[i].st_value > addr
2686                     && mod->symtab[i].st_value < nextval
2687                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2688                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2689                         nextval = mod->symtab[i].st_value;
2690         }
2691
2692         if (!best)
2693                 return NULL;
2694
2695         if (size)
2696                 *size = nextval - mod->symtab[best].st_value;
2697         if (offset)
2698                 *offset = addr - mod->symtab[best].st_value;
2699         return mod->strtab + mod->symtab[best].st_name;
2700 }
2701
2702 /* For kallsyms to ask for address resolution.  NULL means not found.  Careful
2703  * not to lock to avoid deadlock on oopses, simply disable preemption. */
2704 const char *module_address_lookup(unsigned long addr,
2705                             unsigned long *size,
2706                             unsigned long *offset,
2707                             char **modname,
2708                             char *namebuf)
2709 {
2710         struct module *mod;
2711         const char *ret = NULL;
2712
2713         preempt_disable();
2714         list_for_each_entry_rcu(mod, &modules, list) {
2715                 if (within_module_init(addr, mod) ||
2716                     within_module_core(addr, mod)) {
2717                         if (modname)
2718                                 *modname = mod->name;
2719                         ret = get_ksymbol(mod, addr, size, offset);
2720                         break;
2721                 }
2722         }
2723         /* Make a copy in here where it's safe */
2724         if (ret) {
2725                 strncpy(namebuf, ret, KSYM_NAME_LEN - 1);
2726                 ret = namebuf;
2727         }
2728         preempt_enable();
2729         return ret;
2730 }
2731
2732 int lookup_module_symbol_name(unsigned long addr, char *symname)
2733 {
2734         struct module *mod;
2735
2736         preempt_disable();
2737         list_for_each_entry_rcu(mod, &modules, list) {
2738                 if (within_module_init(addr, mod) ||
2739                     within_module_core(addr, mod)) {
2740                         const char *sym;
2741
2742                         sym = get_ksymbol(mod, addr, NULL, NULL);
2743                         if (!sym)
2744                                 goto out;
2745                         strlcpy(symname, sym, KSYM_NAME_LEN);
2746                         preempt_enable();
2747                         return 0;
2748                 }
2749         }
2750 out:
2751         preempt_enable();
2752         return -ERANGE;
2753 }
2754
2755 int lookup_module_symbol_attrs(unsigned long addr, unsigned long *size,
2756                         unsigned long *offset, char *modname, char *name)
2757 {
2758         struct module *mod;
2759
2760         preempt_disable();
2761         list_for_each_entry_rcu(mod, &modules, list) {
2762                 if (within_module_init(addr, mod) ||
2763                     within_module_core(addr, mod)) {
2764                         const char *sym;
2765
2766                         sym = get_ksymbol(mod, addr, size, offset);
2767                         if (!sym)
2768                                 goto out;
2769                         if (modname)
2770                                 strlcpy(modname, mod->name, MODULE_NAME_LEN);
2771                         if (name)
2772                                 strlcpy(name, sym, KSYM_NAME_LEN);
2773                         preempt_enable();
2774                         return 0;
2775                 }
2776         }
2777 out:
2778         preempt_enable();
2779         return -ERANGE;
2780 }
2781
2782 int module_get_kallsym(unsigned int symnum, unsigned long *value, char *type,
2783                         char *name, char *module_name, int *exported)
2784 {
2785         struct module *mod;
2786
2787         preempt_disable();
2788         list_for_each_entry_rcu(mod, &modules, list) {
2789                 if (symnum < mod->num_symtab) {
2790                         *value = mod->symtab[symnum].st_value;
2791                         *type = mod->symtab[symnum].st_info;
2792                         strlcpy(name, mod->strtab + mod->symtab[symnum].st_name,
2793                                 KSYM_NAME_LEN);
2794                         strlcpy(module_name, mod->name, MODULE_NAME_LEN);
2795                         *exported = is_exported(name, *value, mod);
2796                         preempt_enable();
2797                         return 0;
2798                 }
2799                 symnum -= mod->num_symtab;
2800         }
2801         preempt_enable();
2802         return -ERANGE;
2803 }
2804
2805 static unsigned long mod_find_symname(struct module *mod, const char *name)
2806 {
2807         unsigned int i;
2808
2809         for (i = 0; i < mod->num_symtab; i++)
2810                 if (strcmp(name, mod->strtab+mod->symtab[i].st_name) == 0 &&
2811                     mod->symtab[i].st_info != 'U')
2812                         return mod->symtab[i].st_value;
2813         return 0;
2814 }
2815
2816 /* Look for this name: can be of form module:name. */
2817 unsigned long module_kallsyms_lookup_name(const char *name)
2818 {
2819         struct module *mod;
2820         char *colon;
2821         unsigned long ret = 0;
2822
2823         /* Don't lock: we're in enough trouble already. */
2824         preempt_disable();
2825         if ((colon = strchr(name, ':')) != NULL) {
2826                 *colon = '\0';
2827                 if ((mod = find_module(name)) != NULL)
2828                         ret = mod_find_symname(mod, colon+1);
2829                 *colon = ':';
2830         } else {
2831                 list_for_each_entry_rcu(mod, &modules, list)
2832                         if ((ret = mod_find_symname(mod, name)) != 0)
2833                                 break;
2834         }
2835         preempt_enable();
2836         return ret;
2837 }
2838
2839 int module_kallsyms_on_each_symbol(int (*fn)(void *, const char *,
2840                                              struct module *, unsigned long),
2841                                    void *data)
2842 {
2843         struct module *mod;
2844         unsigned int i;
2845         int ret;
2846
2847         list_for_each_entry(mod, &modules, list) {
2848                 for (i = 0; i < mod->num_symtab; i++) {
2849                         ret = fn(data, mod->strtab + mod->symtab[i].st_name,
2850                                  mod, mod->symtab[i].st_value);
2851                         if (ret != 0)
2852                                 return ret;
2853                 }
2854         }
2855         return 0;
2856 }
2857 #endif /* CONFIG_KALLSYMS */
2858
2859 static char *module_flags(struct module *mod, char *buf)
2860 {
2861         int bx = 0;
2862
2863         if (mod->taints ||
2864             mod->state == MODULE_STATE_GOING ||
2865             mod->state == MODULE_STATE_COMING) {
2866                 buf[bx++] = '(';
2867                 if (mod->taints & (1 << TAINT_PROPRIETARY_MODULE))
2868                         buf[bx++] = 'P';
2869                 if (mod->taints & (1 << TAINT_FORCED_MODULE))
2870                         buf[bx++] = 'F';
2871                 if (mod->taints & (1 << TAINT_CRAP))
2872                         buf[bx++] = 'C';
2873                 /*
2874                  * TAINT_FORCED_RMMOD: could be added.
2875                  * TAINT_UNSAFE_SMP, TAINT_MACHINE_CHECK, TAINT_BAD_PAGE don't
2876                  * apply to modules.
2877                  */
2878
2879                 /* Show a - for module-is-being-unloaded */
2880                 if (mod->state == MODULE_STATE_GOING)
2881                         buf[bx++] = '-';
2882                 /* Show a + for module-is-being-loaded */
2883                 if (mod->state == MODULE_STATE_COMING)
2884                         buf[bx++] = '+';
2885                 buf[bx++] = ')';
2886         }
2887         buf[bx] = '\0';
2888
2889         return buf;
2890 }
2891
2892 #ifdef CONFIG_PROC_FS
2893 /* Called by the /proc file system to return a list of modules. */
2894 static void *m_start(struct seq_file *m, loff_t *pos)
2895 {
2896         mutex_lock(&module_mutex);
2897         return seq_list_start(&modules, *pos);
2898 }
2899
2900 static void *m_next(struct seq_file *m, void *p, loff_t *pos)
2901 {
2902         return seq_list_next(p, &modules, pos);
2903 }
2904
2905 static void m_stop(struct seq_file *m, void *p)
2906 {
2907         mutex_unlock(&module_mutex);
2908 }
2909
2910 static int m_show(struct seq_file *m, void *p)
2911 {
2912         struct module *mod = list_entry(p, struct module, list);
2913         char buf[8];
2914
2915         seq_printf(m, "%s %u",
2916                    mod->name, mod->init_size + mod->core_size);
2917         print_unload_info(m, mod);
2918
2919         /* Informative for users. */
2920         seq_printf(m, " %s",
2921                    mod->state == MODULE_STATE_GOING ? "Unloading":
2922                    mod->state == MODULE_STATE_COMING ? "Loading":
2923                    "Live");
2924         /* Used by oprofile and other similar tools. */
2925         seq_printf(m, " 0x%p", mod->module_core);
2926
2927         /* Taints info */
2928         if (mod->taints)
2929                 seq_printf(m, " %s", module_flags(mod, buf));
2930
2931         seq_printf(m, "\n");
2932         return 0;
2933 }
2934
2935 /* Format: modulename size refcount deps address
2936
2937    Where refcount is a number or -, and deps is a comma-separated list
2938    of depends or -.
2939 */
2940 static const struct seq_operations modules_op = {
2941         .start  = m_start,
2942         .next   = m_next,
2943         .stop   = m_stop,
2944         .show   = m_show
2945 };
2946
2947 static int modules_open(struct inode *inode, struct file *file)
2948 {
2949         return seq_open(file, &modules_op);
2950 }
2951
2952 static const struct file_operations proc_modules_operations = {
2953         .open           = modules_open,
2954         .read           = seq_read,
2955         .llseek         = seq_lseek,
2956         .release        = seq_release,
2957 };
2958
2959 static int __init proc_modules_init(void)
2960 {
2961         proc_create("modules", 0, NULL, &proc_modules_operations);
2962         return 0;
2963 }
2964 module_init(proc_modules_init);
2965 #endif
2966
2967 /* Given an address, look for it in the module exception tables. */
2968 const struct exception_table_entry *search_module_extables(unsigned long addr)
2969 {
2970         const struct exception_table_entry *e = NULL;
2971         struct module *mod;
2972
2973         preempt_disable();
2974         list_for_each_entry_rcu(mod, &modules, list) {
2975                 if (mod->num_exentries == 0)
2976                         continue;
2977
2978                 e = search_extable(mod->extable,
2979                                    mod->extable + mod->num_exentries - 1,
2980                                    addr);
2981                 if (e)
2982                         break;
2983         }
2984         preempt_enable();
2985
2986         /* Now, if we found one, we are running inside it now, hence
2987            we cannot unload the module, hence no refcnt needed. */
2988         return e;
2989 }
2990
2991 /*
2992  * is_module_address - is this address inside a module?
2993  * @addr: the address to check.
2994  *
2995  * See is_module_text_address() if you simply want to see if the address
2996  * is code (not data).
2997  */
2998 bool is_module_address(unsigned long addr)
2999 {
3000         bool ret;
3001
3002         preempt_disable();
3003         ret = __module_address(addr) != NULL;
3004         preempt_enable();
3005
3006         return ret;
3007 }
3008
3009 /*
3010  * __module_address - get the module which contains an address.
3011  * @addr: the address.
3012  *
3013  * Must be called with preempt disabled or module mutex held so that
3014  * module doesn't get freed during this.
3015  */
3016 struct module *__module_address(unsigned long addr)
3017 {
3018         struct module *mod;
3019
3020         if (addr < module_addr_min || addr > module_addr_max)
3021                 return NULL;
3022
3023         list_for_each_entry_rcu(mod, &modules, list)
3024                 if (within_module_core(addr, mod)
3025                     || within_module_init(addr, mod))
3026                         return mod;
3027         return NULL;
3028 }
3029 EXPORT_SYMBOL_GPL(__module_address);
3030
3031 /*
3032  * is_module_text_address - is this address inside module code?
3033  * @addr: the address to check.
3034  *
3035  * See is_module_address() if you simply want to see if the address is
3036  * anywhere in a module.  See kernel_text_address() for testing if an
3037  * address corresponds to kernel or module code.
3038  */
3039 bool is_module_text_address(unsigned long addr)
3040 {
3041         bool ret;
3042
3043         preempt_disable();
3044         ret = __module_text_address(addr) != NULL;
3045         preempt_enable();
3046
3047         return ret;
3048 }
3049
3050 /*
3051  * __module_text_address - get the module whose code contains an address.
3052  * @addr: the address.
3053  *
3054  * Must be called with preempt disabled or module mutex held so that
3055  * module doesn't get freed during this.
3056  */
3057 struct module *__module_text_address(unsigned long addr)
3058 {
3059         struct module *mod = __module_address(addr);
3060         if (mod) {
3061                 /* Make sure it's within the text section. */
3062                 if (!within(addr, mod->module_init, mod->init_text_size)
3063                     && !within(addr, mod->module_core, mod->core_text_size))
3064                         mod = NULL;
3065         }
3066         return mod;
3067 }
3068 EXPORT_SYMBOL_GPL(__module_text_address);
3069
3070 /* Don't grab lock, we're oopsing. */
3071 void print_modules(void)
3072 {
3073         struct module *mod;
3074         char buf[8];
3075
3076         printk(KERN_DEFAULT "Modules linked in:");
3077         /* Most callers should already have preempt disabled, but make sure */
3078         preempt_disable();
3079         list_for_each_entry_rcu(mod, &modules, list)
3080                 printk(" %s%s", mod->name, module_flags(mod, buf));
3081         preempt_enable();
3082         if (last_unloaded_module[0])
3083                 printk(" [last unloaded: %s]", last_unloaded_module);
3084         printk("\n");
3085 }
3086
3087 #ifdef CONFIG_MODVERSIONS
3088 /* Generate the signature for all relevant module structures here.
3089  * If these change, we don't want to try to parse the module. */
3090 void module_layout(struct module *mod,
3091                    struct modversion_info *ver,
3092                    struct kernel_param *kp,
3093                    struct kernel_symbol *ks,
3094                    struct marker *marker,
3095                    struct tracepoint *tp)
3096 {
3097 }
3098 EXPORT_SYMBOL(module_layout);
3099 #endif
3100
3101 #ifdef CONFIG_TRACEPOINTS
3102 void module_update_tracepoints(void)
3103 {
3104         struct module *mod;
3105
3106         mutex_lock(&module_mutex);
3107         list_for_each_entry(mod, &modules, list)
3108                 if (!mod->taints)
3109                         tracepoint_update_probe_range(mod->tracepoints,
3110                                 mod->tracepoints + mod->num_tracepoints);
3111         mutex_unlock(&module_mutex);
3112 }
3113
3114 /*
3115  * Returns 0 if current not found.
3116  * Returns 1 if current found.
3117  */
3118 int module_get_iter_tracepoints(struct tracepoint_iter *iter)
3119 {
3120         struct module *iter_mod;
3121         int found = 0;
3122
3123         mutex_lock(&module_mutex);
3124         list_for_each_entry(iter_mod, &modules, list) {
3125                 if (!iter_mod->taints) {
3126                         /*
3127                          * Sorted module list
3128                          */
3129                         if (iter_mod < iter->module)
3130                                 continue;
3131                         else if (iter_mod > iter->module)
3132                                 iter->tracepoint = NULL;
3133                         found = tracepoint_get_iter_range(&iter->tracepoint,
3134                                 iter_mod->tracepoints,
3135                                 iter_mod->tracepoints
3136                                         + iter_mod->num_tracepoints);
3137                         if (found) {
3138                                 iter->module = iter_mod;
3139                                 break;
3140                         }
3141                 }
3142         }
3143         mutex_unlock(&module_mutex);
3144         return found;
3145 }
3146 #endif