Merge commit 'v3.4.9' into android-t114-3.4
[linux-2.6.git] / arch / arm / kernel / smp.c
1 /*
2  *  linux/arch/arm/kernel/smp.c
3  *
4  *  Copyright (C) 2002 ARM Limited, All Rights Reserved.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 as
8  * published by the Free Software Foundation.
9  */
10 #include <linux/module.h>
11 #include <linux/delay.h>
12 #include <linux/init.h>
13 #include <linux/spinlock.h>
14 #include <linux/sched.h>
15 #include <linux/interrupt.h>
16 #include <linux/cache.h>
17 #include <linux/profile.h>
18 #include <linux/errno.h>
19 #include <linux/mm.h>
20 #include <linux/err.h>
21 #include <linux/cpu.h>
22 #include <linux/smp.h>
23 #include <linux/seq_file.h>
24 #include <linux/irq.h>
25 #include <linux/percpu.h>
26 #include <linux/clockchips.h>
27 #include <linux/completion.h>
28
29 #include <linux/atomic.h>
30 #include <asm/soc.h>
31 #include <asm/cacheflush.h>
32 #include <asm/cpu.h>
33 #include <asm/cputype.h>
34 #include <asm/exception.h>
35 #include <asm/idmap.h>
36 #include <asm/topology.h>
37 #include <asm/mmu_context.h>
38 #include <asm/pgtable.h>
39 #include <asm/pgalloc.h>
40 #include <asm/processor.h>
41 #include <asm/sections.h>
42 #include <asm/tlbflush.h>
43 #include <asm/ptrace.h>
44 #include <asm/localtimer.h>
45 #include <asm/idmap.h>
46 #include <asm/smp_plat.h>
47
48 /*
49  * as from 2.5, kernels no longer have an init_tasks structure
50  * so we need some other way of telling a new secondary core
51  * where to place its SVC stack
52  */
53 struct secondary_data secondary_data;
54
55 enum ipi_msg_type {
56         IPI_TIMER = 2,
57         IPI_RESCHEDULE,
58         IPI_CALL_FUNC,
59         IPI_CALL_FUNC_SINGLE,
60         IPI_CPU_STOP,
61         IPI_CPU_BACKTRACE,
62 };
63
64 static DECLARE_COMPLETION(cpu_running);
65
66 int __cpuinit __cpu_up(unsigned int cpu)
67 {
68         struct cpuinfo_arm *ci = &per_cpu(cpu_data, cpu);
69         struct task_struct *idle = ci->idle;
70         int ret;
71
72         /*
73          * Spawn a new process manually, if not already done.
74          * Grab a pointer to its task struct so we can mess with it
75          */
76         if (!idle) {
77                 idle = fork_idle(cpu);
78                 if (IS_ERR(idle)) {
79                         printk(KERN_ERR "CPU%u: fork() failed\n", cpu);
80                         return PTR_ERR(idle);
81                 }
82                 ci->idle = idle;
83         } else {
84                 /*
85                  * Since this idle thread is being re-used, call
86                  * init_idle() to reinitialize the thread structure.
87                  */
88                 init_idle(idle, cpu);
89         }
90
91         /*
92          * We need to tell the secondary core where to find
93          * its stack and the page tables.
94          */
95         secondary_data.stack = task_stack_page(idle) + THREAD_START_SP;
96         secondary_data.pgdir = virt_to_phys(idmap_pgd);
97         secondary_data.swapper_pg_dir = virt_to_phys(swapper_pg_dir);
98         __cpuc_flush_dcache_area(&secondary_data, sizeof(secondary_data));
99         outer_clean_range(__pa(&secondary_data), __pa(&secondary_data + 1));
100
101         /*
102          * Now bring the CPU into our world.
103          */
104         ret = boot_secondary(cpu, idle);
105         if (ret == 0) {
106                 /*
107                  * CPU was successfully started, wait for it
108                  * to come online or time out.
109                  */
110                 wait_for_completion_timeout(&cpu_running,
111                                                  msecs_to_jiffies(1000));
112
113                 if (!cpu_online(cpu)) {
114                         pr_crit("CPU%u: failed to come online\n", cpu);
115                         ret = -EIO;
116                 }
117         } else {
118                 pr_err("CPU%u: failed to boot: %d\n", cpu, ret);
119         }
120
121         secondary_data.stack = NULL;
122         secondary_data.pgdir = 0;
123
124         return ret;
125 }
126
127 /* SoC helpers */
128 static const struct arm_soc_smp_init_ops *soc_smp_init_ops  __initdata;
129 static const struct arm_soc_smp_ops *soc_smp_ops;
130 static struct arm_soc_smp_ops __soc_smp_ops;
131
132 void __init soc_smp_ops_register(struct arm_soc_smp_init_ops *smp_init_ops,
133                                  struct arm_soc_smp_ops *smp_ops)
134 {
135         if (smp_init_ops)
136                 soc_smp_init_ops = smp_init_ops;
137
138         /*
139          * Warning: we're copying an __initdata structure into a
140          * __cpuinitdata structure. We *know* it is valid because only
141          * __cpuinit (or more persistant) functions should be pointed
142          * to by soc_smp_ops. Still, this is borderline ugly.
143          */
144         if (smp_ops) {
145                 __soc_smp_ops = *smp_ops;
146                 soc_smp_ops = &__soc_smp_ops;
147         }
148 }
149
150 void __init smp_init_cpus(void)
151 {
152         if (soc_smp_init_ops && soc_smp_init_ops->smp_init_cpus)
153                 soc_smp_init_ops->smp_init_cpus();
154 }
155
156 static void __init platform_smp_prepare_cpus(unsigned int max_cpus)
157 {
158         if (soc_smp_ops && soc_smp_init_ops->smp_prepare_cpus)
159                 soc_smp_init_ops->smp_prepare_cpus(max_cpus);
160 }
161
162 static void __cpuinit platform_secondary_init(unsigned int cpu)
163 {
164         if (soc_smp_ops && soc_smp_ops->smp_secondary_init)
165                 soc_smp_ops->smp_secondary_init(cpu);
166 }
167
168 int __cpuinit boot_secondary(unsigned int cpu, struct task_struct *idle)
169 {
170         if (soc_smp_ops && soc_smp_ops->smp_boot_secondary)
171                 return soc_smp_ops->smp_boot_secondary(cpu, idle);
172         return -ENOSYS;
173 }
174
175 #ifdef CONFIG_HOTPLUG_CPU
176 static void percpu_timer_stop(void);
177
178 int dummy_cpu_kill(unsigned int cpu)
179 {
180         return 1;
181 }
182
183 int dummy_cpu_disable(unsigned int cpu)
184 {
185         /*
186          * we don't allow CPU 0 to be shutdown (it is still too special
187          * e.g. clock tick interrupts)
188          */
189         return cpu == 0 ? -EPERM : 0;
190 }
191
192 static int platform_cpu_kill(unsigned int cpu)
193 {
194         if (soc_smp_ops && soc_smp_ops->cpu_kill)
195                 return soc_smp_ops->cpu_kill(cpu);
196         return 0;
197 }
198
199 static void __cpuinit platform_cpu_die(unsigned int cpu)
200 {
201         if (soc_smp_ops && soc_smp_ops->cpu_die)
202                 soc_smp_ops->cpu_die(cpu);
203 }
204
205 static int __cpuinit platform_cpu_disable(unsigned int cpu)
206 {
207         if (soc_smp_ops && soc_smp_ops->cpu_disable)
208                 return soc_smp_ops->cpu_disable(cpu);
209         return -EPERM;
210 }
211
212 /*
213  * __cpu_disable runs on the processor to be shutdown.
214  */
215 int __cpuinit __cpu_disable(void)
216 {
217         unsigned int cpu = smp_processor_id();
218         struct task_struct *p;
219         int ret;
220
221         ret = platform_cpu_disable(cpu);
222         if (ret)
223                 return ret;
224
225         /*
226          * Take this CPU offline.  Once we clear this, we can't return,
227          * and we must not schedule until we're ready to give up the cpu.
228          */
229         set_cpu_online(cpu, false);
230
231         /*
232          * OK - migrate IRQs away from this CPU
233          */
234         migrate_irqs();
235
236         /*
237          * Stop the local timer for this CPU.
238          */
239         percpu_timer_stop();
240
241         /*
242          * Flush user cache and TLB mappings, and then remove this CPU
243          * from the vm mask set of all processes.
244          */
245         flush_cache_all();
246         local_flush_tlb_all();
247
248         read_lock(&tasklist_lock);
249         for_each_process(p) {
250                 if (p->mm)
251                         cpumask_clear_cpu(cpu, mm_cpumask(p->mm));
252         }
253         read_unlock(&tasklist_lock);
254
255         return 0;
256 }
257
258 static DECLARE_COMPLETION(cpu_died);
259
260 /*
261  * called on the thread which is asking for a CPU to be shutdown -
262  * waits until shutdown has completed, or it is timed out.
263  */
264 void __cpuinit __cpu_die(unsigned int cpu)
265 {
266         if (!wait_for_completion_timeout(&cpu_died, msecs_to_jiffies(5000))) {
267                 pr_err("CPU%u: cpu didn't die\n", cpu);
268                 return;
269         }
270         printk(KERN_NOTICE "CPU%u: shutdown\n", cpu);
271
272         if (!platform_cpu_kill(cpu))
273                 printk("CPU%u: unable to kill\n", cpu);
274 }
275
276 /*
277  * Called from the idle thread for the CPU which has been shutdown.
278  *
279  * Note that we disable IRQs here, but do not re-enable them
280  * before returning to the caller. This is also the behaviour
281  * of the other hotplug-cpu capable cores, so presumably coming
282  * out of idle fixes this.
283  */
284 void __ref cpu_die(void)
285 {
286         unsigned int cpu = smp_processor_id();
287
288         idle_task_exit();
289
290         local_irq_disable();
291         mb();
292
293         /* Tell __cpu_die() that this CPU is now safe to dispose of */
294         complete(&cpu_died);
295
296         /*
297          * actual CPU shutdown procedure is at least platform (if not
298          * CPU) specific.
299          */
300         platform_cpu_die(cpu);
301
302         /*
303          * Do not return to the idle loop - jump back to the secondary
304          * cpu initialisation.  There's some initialisation which needs
305          * to be repeated to undo the effects of taking the CPU offline.
306          */
307         __asm__("mov    sp, %0\n"
308         "       mov     fp, #0\n"
309         "       b       secondary_start_kernel"
310                 :
311                 : "r" (task_stack_page(current) + THREAD_SIZE - 8));
312 }
313 #endif /* CONFIG_HOTPLUG_CPU */
314
315 /*
316  * Called by both boot and secondaries to move global data into
317  * per-processor storage.
318  */
319 static void __cpuinit smp_store_cpu_info(unsigned int cpuid)
320 {
321         struct cpuinfo_arm *cpu_info = &per_cpu(cpu_data, cpuid);
322
323         cpu_info->loops_per_jiffy = loops_per_jiffy;
324
325         store_cpu_topology(cpuid);
326 }
327
328 static void percpu_timer_setup(void);
329
330 /*
331  * This is the secondary CPU boot entry.  We're using this CPUs
332  * idle thread stack, but a set of temporary page tables.
333  */
334 asmlinkage void __cpuinit secondary_start_kernel(void)
335 {
336         struct mm_struct *mm = &init_mm;
337         unsigned int cpu = smp_processor_id();
338
339         /*
340          * All kernel threads share the same mm context; grab a
341          * reference and switch to it.
342          */
343         atomic_inc(&mm->mm_count);
344         current->active_mm = mm;
345         cpumask_set_cpu(cpu, mm_cpumask(mm));
346         cpu_switch_mm(mm->pgd, mm);
347         enter_lazy_tlb(mm, current);
348         local_flush_tlb_all();
349
350         cpu_init();
351         preempt_disable();
352         trace_hardirqs_off();
353
354         /*
355          * Give the platform a chance to do its own initialisation.
356          */
357         platform_secondary_init(cpu);
358
359         notify_cpu_starting(cpu);
360
361         calibrate_delay();
362
363         smp_store_cpu_info(cpu);
364
365         /*
366          * OK, now it's safe to let the boot CPU continue.  Wait for
367          * the CPU migration code to notice that the CPU is online
368          * before we continue - which happens after __cpu_up returns.
369          */
370         set_cpu_online(cpu, true);
371         complete(&cpu_running);
372         printk("CPU%u: Booted secondary processor\n", cpu);
373
374         /*
375          * Setup the percpu timer for this CPU.
376          */
377         percpu_timer_setup();
378
379         local_irq_enable();
380         local_fiq_enable();
381
382         /*
383          * OK, it's off to the idle thread for us
384          */
385         cpu_idle();
386 }
387
388 void __init smp_cpus_done(unsigned int max_cpus)
389 {
390         int cpu;
391         unsigned long bogosum = 0;
392
393         for_each_online_cpu(cpu)
394                 bogosum += per_cpu(cpu_data, cpu).loops_per_jiffy;
395
396         printk(KERN_INFO "SMP: Total of %d processors activated "
397                "(%lu.%02lu BogoMIPS).\n",
398                num_online_cpus(),
399                bogosum / (500000/HZ),
400                (bogosum / (5000/HZ)) % 100);
401 }
402
403 void __init smp_prepare_boot_cpu(void)
404 {
405         unsigned int cpu = smp_processor_id();
406
407         per_cpu(cpu_data, cpu).idle = current;
408 }
409
410 void __init smp_prepare_cpus(unsigned int max_cpus)
411 {
412         unsigned int ncores = num_possible_cpus();
413
414         init_cpu_topology();
415
416         smp_store_cpu_info(smp_processor_id());
417
418         /*
419          * are we trying to boot more cores than exist?
420          */
421         if (max_cpus > ncores)
422                 max_cpus = ncores;
423         if (ncores > 1 && max_cpus) {
424                 /*
425                  * Enable the local timer or broadcast device for the
426                  * boot CPU, but only if we have more than one CPU.
427                  */
428                 percpu_timer_setup();
429
430                 /*
431                  * Initialise the present map, which describes the set of CPUs
432                  * actually populated at the present time. A platform should
433                  * re-initialize the map in platform_smp_prepare_cpus() if
434                  * present != possible (e.g. physical hotplug).
435                  */
436                 init_cpu_present(cpu_possible_mask);
437
438                 /*
439                  * Initialise the SCU if there are more than one CPU
440                  * and let them know where to start.
441                  */
442                 platform_smp_prepare_cpus(max_cpus);
443         }
444 }
445
446 static void (*smp_cross_call)(const struct cpumask *, unsigned int);
447
448 void __init set_smp_cross_call(void (*fn)(const struct cpumask *, unsigned int))
449 {
450         smp_cross_call = fn;
451 }
452
453 void arch_send_call_function_ipi_mask(const struct cpumask *mask)
454 {
455         smp_cross_call(mask, IPI_CALL_FUNC);
456 }
457
458 void arch_send_call_function_single_ipi(int cpu)
459 {
460         smp_cross_call(cpumask_of(cpu), IPI_CALL_FUNC_SINGLE);
461 }
462
463 static const char *ipi_types[NR_IPI] = {
464 #define S(x,s)  [x - IPI_TIMER] = s
465         S(IPI_TIMER, "Timer broadcast interrupts"),
466         S(IPI_RESCHEDULE, "Rescheduling interrupts"),
467         S(IPI_CALL_FUNC, "Function call interrupts"),
468         S(IPI_CALL_FUNC_SINGLE, "Single function call interrupts"),
469         S(IPI_CPU_STOP, "CPU stop interrupts"),
470         S(IPI_CPU_BACKTRACE, "CPU backtrace"),
471 };
472
473 void show_ipi_list(struct seq_file *p, int prec)
474 {
475         unsigned int cpu, i;
476
477         for (i = 0; i < NR_IPI; i++) {
478                 seq_printf(p, "%*s%u: ", prec - 1, "IPI", i);
479
480                 for_each_present_cpu(cpu)
481                         seq_printf(p, "%10u ",
482                                    __get_irq_stat(cpu, ipi_irqs[i]));
483
484                 seq_printf(p, " %s\n", ipi_types[i]);
485         }
486 }
487
488 u64 smp_irq_stat_cpu(unsigned int cpu)
489 {
490         u64 sum = 0;
491         int i;
492
493         for (i = 0; i < NR_IPI; i++)
494                 sum += __get_irq_stat(cpu, ipi_irqs[i]);
495
496         return sum;
497 }
498
499 /*
500  * Timer (local or broadcast) support
501  */
502 static DEFINE_PER_CPU(struct clock_event_device, percpu_clockevent);
503
504 static void ipi_timer(void)
505 {
506         struct clock_event_device *evt = &__get_cpu_var(percpu_clockevent);
507         irq_enter();
508         evt->event_handler(evt);
509         irq_exit();
510 }
511
512 #ifdef CONFIG_GENERIC_CLOCKEVENTS_BROADCAST
513 static void smp_timer_broadcast(const struct cpumask *mask)
514 {
515         smp_cross_call(mask, IPI_TIMER);
516 }
517 #else
518 #define smp_timer_broadcast     NULL
519 #endif
520
521 static void broadcast_timer_set_mode(enum clock_event_mode mode,
522         struct clock_event_device *evt)
523 {
524 }
525
526 static void __cpuinit broadcast_timer_setup(struct clock_event_device *evt)
527 {
528         evt->name       = "dummy_timer";
529         evt->features   = CLOCK_EVT_FEAT_ONESHOT |
530                           CLOCK_EVT_FEAT_PERIODIC |
531                           CLOCK_EVT_FEAT_DUMMY;
532         evt->rating     = 400;
533         evt->mult       = 1;
534         evt->set_mode   = broadcast_timer_set_mode;
535
536         clockevents_register_device(evt);
537 }
538
539 static struct local_timer_ops *lt_ops;
540
541 #ifdef CONFIG_LOCAL_TIMERS
542 int local_timer_register(struct local_timer_ops *ops)
543 {
544         if (!is_smp() || !setup_max_cpus)
545                 return -ENXIO;
546
547         if (lt_ops)
548                 return -EBUSY;
549
550         lt_ops = ops;
551         return 0;
552 }
553 #endif
554
555 static void __cpuinit percpu_timer_setup(void)
556 {
557         unsigned int cpu = smp_processor_id();
558         struct clock_event_device *evt = &per_cpu(percpu_clockevent, cpu);
559
560         evt->cpumask = cpumask_of(cpu);
561         evt->broadcast = smp_timer_broadcast;
562
563         if (!lt_ops || lt_ops->setup(evt))
564                 broadcast_timer_setup(evt);
565 }
566
567 #ifdef CONFIG_HOTPLUG_CPU
568 /*
569  * The generic clock events code purposely does not stop the local timer
570  * on CPU_DEAD/CPU_DEAD_FROZEN hotplug events, so we have to do it
571  * manually here.
572  */
573 static void percpu_timer_stop(void)
574 {
575         unsigned int cpu = smp_processor_id();
576         struct clock_event_device *evt = &per_cpu(percpu_clockevent, cpu);
577
578         if (lt_ops)
579                 lt_ops->stop(evt);
580 }
581 #endif
582
583 static DEFINE_RAW_SPINLOCK(stop_lock);
584
585 /*
586  * ipi_cpu_stop - handle IPI from smp_send_stop()
587  */
588 static void ipi_cpu_stop(unsigned int cpu)
589 {
590         if (system_state == SYSTEM_BOOTING ||
591             system_state == SYSTEM_RUNNING) {
592                 raw_spin_lock(&stop_lock);
593                 printk(KERN_CRIT "CPU%u: stopping\n", cpu);
594                 dump_stack();
595                 raw_spin_unlock(&stop_lock);
596         }
597
598         set_cpu_online(cpu, false);
599
600         local_fiq_disable();
601         local_irq_disable();
602
603 #ifdef CONFIG_HOTPLUG_CPU
604         platform_cpu_kill(cpu);
605 #endif
606
607         while (1)
608                 cpu_relax();
609 }
610
611 static cpumask_t backtrace_mask;
612 static DEFINE_RAW_SPINLOCK(backtrace_lock);
613
614 /* "in progress" flag of arch_trigger_all_cpu_backtrace */
615 static unsigned long backtrace_flag;
616
617 void smp_send_all_cpu_backtrace(void)
618 {
619         unsigned int this_cpu = smp_processor_id();
620         int i;
621
622         if (test_and_set_bit(0, &backtrace_flag))
623                 /*
624                  * If there is already a trigger_all_cpu_backtrace() in progress
625                  * (backtrace_flag == 1), don't output double cpu dump infos.
626                  */
627                 return;
628
629         cpumask_copy(&backtrace_mask, cpu_online_mask);
630         cpu_clear(this_cpu, backtrace_mask);
631
632         pr_info("Backtrace for cpu %d (current):\n", this_cpu);
633         dump_stack();
634
635         pr_info("\nsending IPI to all other CPUs:\n");
636         smp_cross_call(&backtrace_mask, IPI_CPU_BACKTRACE);
637
638         /* Wait for up to 10 seconds for all other CPUs to do the backtrace */
639         for (i = 0; i < 10 * 1000; i++) {
640                 if (cpumask_empty(&backtrace_mask))
641                         break;
642                 mdelay(1);
643         }
644
645         clear_bit(0, &backtrace_flag);
646         smp_mb__after_clear_bit();
647 }
648
649 /*
650  * ipi_cpu_backtrace - handle IPI from smp_send_all_cpu_backtrace()
651  */
652 static void ipi_cpu_backtrace(unsigned int cpu, struct pt_regs *regs)
653 {
654         if (cpu_isset(cpu, backtrace_mask)) {
655                 raw_spin_lock(&backtrace_lock);
656                 pr_warning("IPI backtrace for cpu %d\n", cpu);
657                 show_regs(regs);
658                 raw_spin_unlock(&backtrace_lock);
659                 cpu_clear(cpu, backtrace_mask);
660         }
661 }
662
663 /*
664  * Main handler for inter-processor interrupts
665  */
666 asmlinkage void __exception_irq_entry do_IPI(int ipinr, struct pt_regs *regs)
667 {
668         handle_IPI(ipinr, regs);
669 }
670
671 void handle_IPI(int ipinr, struct pt_regs *regs)
672 {
673         unsigned int cpu = smp_processor_id();
674         struct pt_regs *old_regs = set_irq_regs(regs);
675
676         if (ipinr >= IPI_TIMER && ipinr < IPI_TIMER + NR_IPI)
677                 __inc_irq_stat(cpu, ipi_irqs[ipinr - IPI_TIMER]);
678
679         switch (ipinr) {
680         case IPI_TIMER:
681                 ipi_timer();
682                 break;
683
684         case IPI_RESCHEDULE:
685                 scheduler_ipi();
686                 break;
687
688         case IPI_CALL_FUNC:
689                 irq_enter();
690                 generic_smp_call_function_interrupt();
691                 irq_exit();
692                 break;
693
694         case IPI_CALL_FUNC_SINGLE:
695                 irq_enter();
696                 generic_smp_call_function_single_interrupt();
697                 irq_exit();
698                 break;
699
700         case IPI_CPU_STOP:
701                 irq_enter();
702                 ipi_cpu_stop(cpu);
703                 irq_exit();
704                 break;
705
706         case IPI_CPU_BACKTRACE:
707                 ipi_cpu_backtrace(cpu, regs);
708                 break;
709
710         default:
711                 printk(KERN_CRIT "CPU%u: Unknown IPI message 0x%x\n",
712                        cpu, ipinr);
713                 break;
714         }
715         set_irq_regs(old_regs);
716 }
717
718 void smp_send_reschedule(int cpu)
719 {
720         smp_cross_call(cpumask_of(cpu), IPI_RESCHEDULE);
721 }
722
723 void smp_send_stop(void)
724 {
725         unsigned long timeout;
726
727         if (num_online_cpus() > 1) {
728                 struct cpumask mask;
729                 cpumask_copy(&mask, cpu_online_mask);
730                 cpumask_clear_cpu(smp_processor_id(), &mask);
731
732                 if (!cpumask_empty(&mask))
733                         smp_cross_call(&mask, IPI_CPU_STOP);
734         }
735
736         /* Wait up to one second for other CPUs to stop */
737         timeout = USEC_PER_SEC;
738         while (num_online_cpus() > 1 && timeout--)
739                 udelay(1);
740
741         if (num_online_cpus() > 1)
742                 pr_warning("SMP: failed to stop secondary CPUs\n");
743 }
744
745 /*
746  * not supported here
747  */
748 int setup_profiling_timer(unsigned int multiplier)
749 {
750         return -EINVAL;
751 }