b165eb0884ed075ad77b88ee3a8a871f4a8df7b2
[linux-3.10.git] / arch / x86 / kernel / reboot.c
1 #include <linux/module.h>
2 #include <linux/reboot.h>
3 #include <linux/init.h>
4 #include <linux/pm.h>
5 #include <linux/efi.h>
6 #include <acpi/reboot.h>
7 #include <asm/io.h>
8 #include <asm/apic.h>
9 #include <asm/desc.h>
10 #include <asm/hpet.h>
11 #include <asm/pgtable.h>
12 #include <asm/proto.h>
13 #include <asm/reboot_fixups.h>
14 #include <asm/reboot.h>
15
16 #ifdef CONFIG_X86_32
17 # include <linux/dmi.h>
18 # include <linux/ctype.h>
19 # include <linux/mc146818rtc.h>
20 #else
21 # include <asm/iommu.h>
22 #endif
23
24 #include <mach_ipi.h>
25 #include "../pci/pci.h"
26
27
28 /*
29  * Power off function, if any
30  */
31 void (*pm_power_off)(void);
32 EXPORT_SYMBOL(pm_power_off);
33
34 static const struct desc_ptr no_idt = {};
35 static int reboot_mode;
36 enum reboot_type reboot_type = BOOT_KBD;
37 int reboot_force;
38
39 #if defined(CONFIG_X86_32) && defined(CONFIG_SMP)
40 static int reboot_cpu = -1;
41 #endif
42
43 /* This is set by the PCI code if either type 1 or type 2 PCI is detected */
44 bool port_cf9_safe = false;
45
46 /* reboot=b[ios] | s[mp] | t[riple] | k[bd] | e[fi] [, [w]arm | [c]old] | p[ci]
47    warm   Don't set the cold reboot flag
48    cold   Set the cold reboot flag
49    bios   Reboot by jumping through the BIOS (only for X86_32)
50    smp    Reboot by executing reset on BSP or other CPU (only for X86_32)
51    triple Force a triple fault (init)
52    kbd    Use the keyboard controller. cold reset (default)
53    acpi   Use the RESET_REG in the FADT
54    efi    Use efi reset_system runtime service
55    pci    Use the so-called "PCI reset register", CF9
56    force  Avoid anything that could hang.
57  */
58 static int __init reboot_setup(char *str)
59 {
60         for (;;) {
61                 switch (*str) {
62                 case 'w':
63                         reboot_mode = 0x1234;
64                         break;
65
66                 case 'c':
67                         reboot_mode = 0;
68                         break;
69
70 #ifdef CONFIG_X86_32
71 #ifdef CONFIG_SMP
72                 case 's':
73                         if (isdigit(*(str+1))) {
74                                 reboot_cpu = (int) (*(str+1) - '0');
75                                 if (isdigit(*(str+2)))
76                                         reboot_cpu = reboot_cpu*10 + (int)(*(str+2) - '0');
77                         }
78                                 /* we will leave sorting out the final value
79                                    when we are ready to reboot, since we might not
80                                    have set up boot_cpu_id or smp_num_cpu */
81                         break;
82 #endif /* CONFIG_SMP */
83
84                 case 'b':
85 #endif
86                 case 'a':
87                 case 'k':
88                 case 't':
89                 case 'e':
90                 case 'p':
91                         reboot_type = *str;
92                         break;
93
94                 case 'f':
95                         reboot_force = 1;
96                         break;
97                 }
98
99                 str = strchr(str, ',');
100                 if (str)
101                         str++;
102                 else
103                         break;
104         }
105         return 1;
106 }
107
108 __setup("reboot=", reboot_setup);
109
110
111 #ifdef CONFIG_X86_32
112 /*
113  * Reboot options and system auto-detection code provided by
114  * Dell Inc. so their systems "just work". :-)
115  */
116
117 /*
118  * Some machines require the "reboot=b"  commandline option,
119  * this quirk makes that automatic.
120  */
121 static int __init set_bios_reboot(const struct dmi_system_id *d)
122 {
123         if (reboot_type != BOOT_BIOS) {
124                 reboot_type = BOOT_BIOS;
125                 printk(KERN_INFO "%s series board detected. Selecting BIOS-method for reboots.\n", d->ident);
126         }
127         return 0;
128 }
129
130 static struct dmi_system_id __initdata reboot_dmi_table[] = {
131         {       /* Handle problems with rebooting on Dell E520's */
132                 .callback = set_bios_reboot,
133                 .ident = "Dell E520",
134                 .matches = {
135                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Inc."),
136                         DMI_MATCH(DMI_PRODUCT_NAME, "Dell DM061"),
137                 },
138         },
139         {       /* Handle problems with rebooting on Dell 1300's */
140                 .callback = set_bios_reboot,
141                 .ident = "Dell PowerEdge 1300",
142                 .matches = {
143                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Computer Corporation"),
144                         DMI_MATCH(DMI_PRODUCT_NAME, "PowerEdge 1300/"),
145                 },
146         },
147         {       /* Handle problems with rebooting on Dell 300's */
148                 .callback = set_bios_reboot,
149                 .ident = "Dell PowerEdge 300",
150                 .matches = {
151                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Computer Corporation"),
152                         DMI_MATCH(DMI_PRODUCT_NAME, "PowerEdge 300/"),
153                 },
154         },
155         {       /* Handle problems with rebooting on Dell Optiplex 745's SFF*/
156                 .callback = set_bios_reboot,
157                 .ident = "Dell OptiPlex 745",
158                 .matches = {
159                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Inc."),
160                         DMI_MATCH(DMI_PRODUCT_NAME, "OptiPlex 745"),
161                 },
162         },
163         {       /* Handle problems with rebooting on Dell Optiplex 745's DFF*/
164                 .callback = set_bios_reboot,
165                 .ident = "Dell OptiPlex 745",
166                 .matches = {
167                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Inc."),
168                         DMI_MATCH(DMI_PRODUCT_NAME, "OptiPlex 745"),
169                         DMI_MATCH(DMI_BOARD_NAME, "0MM599"),
170                 },
171         },
172         {       /* Handle problems with rebooting on Dell Optiplex 745 with 0KW626 */
173                 .callback = set_bios_reboot,
174                 .ident = "Dell OptiPlex 745",
175                 .matches = {
176                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Inc."),
177                         DMI_MATCH(DMI_PRODUCT_NAME, "OptiPlex 745"),
178                         DMI_MATCH(DMI_BOARD_NAME, "0KW626"),
179                 },
180         },
181         {   /* Handle problems with rebooting on Dell Optiplex 330 with 0KP561 */
182                 .callback = set_bios_reboot,
183                 .ident = "Dell OptiPlex 330",
184                 .matches = {
185                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Inc."),
186                         DMI_MATCH(DMI_PRODUCT_NAME, "OptiPlex 330"),
187                         DMI_MATCH(DMI_BOARD_NAME, "0KP561"),
188                 },
189         },
190         {       /* Handle problems with rebooting on Dell 2400's */
191                 .callback = set_bios_reboot,
192                 .ident = "Dell PowerEdge 2400",
193                 .matches = {
194                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Computer Corporation"),
195                         DMI_MATCH(DMI_PRODUCT_NAME, "PowerEdge 2400"),
196                 },
197         },
198         {       /* Handle problems with rebooting on Dell T5400's */
199                 .callback = set_bios_reboot,
200                 .ident = "Dell Precision T5400",
201                 .matches = {
202                         DMI_MATCH(DMI_SYS_VENDOR, "Dell Inc."),
203                         DMI_MATCH(DMI_PRODUCT_NAME, "Precision WorkStation T5400"),
204                 },
205         },
206         {       /* Handle problems with rebooting on HP laptops */
207                 .callback = set_bios_reboot,
208                 .ident = "HP Compaq Laptop",
209                 .matches = {
210                         DMI_MATCH(DMI_SYS_VENDOR, "Hewlett-Packard"),
211                         DMI_MATCH(DMI_PRODUCT_NAME, "HP Compaq"),
212                 },
213         },
214         { }
215 };
216
217 static int __init reboot_init(void)
218 {
219         dmi_check_system(reboot_dmi_table);
220         return 0;
221 }
222 core_initcall(reboot_init);
223
224 /* The following code and data reboots the machine by switching to real
225    mode and jumping to the BIOS reset entry point, as if the CPU has
226    really been reset.  The previous version asked the keyboard
227    controller to pulse the CPU reset line, which is more thorough, but
228    doesn't work with at least one type of 486 motherboard.  It is easy
229    to stop this code working; hence the copious comments. */
230 static const unsigned long long
231 real_mode_gdt_entries [3] =
232 {
233         0x0000000000000000ULL,  /* Null descriptor */
234         0x00009b000000ffffULL,  /* 16-bit real-mode 64k code at 0x00000000 */
235         0x000093000100ffffULL   /* 16-bit real-mode 64k data at 0x00000100 */
236 };
237
238 static const struct desc_ptr
239 real_mode_gdt = { sizeof (real_mode_gdt_entries) - 1, (long)real_mode_gdt_entries },
240 real_mode_idt = { 0x3ff, 0 };
241
242 /* This is 16-bit protected mode code to disable paging and the cache,
243    switch to real mode and jump to the BIOS reset code.
244
245    The instruction that switches to real mode by writing to CR0 must be
246    followed immediately by a far jump instruction, which set CS to a
247    valid value for real mode, and flushes the prefetch queue to avoid
248    running instructions that have already been decoded in protected
249    mode.
250
251    Clears all the flags except ET, especially PG (paging), PE
252    (protected-mode enable) and TS (task switch for coprocessor state
253    save).  Flushes the TLB after paging has been disabled.  Sets CD and
254    NW, to disable the cache on a 486, and invalidates the cache.  This
255    is more like the state of a 486 after reset.  I don't know if
256    something else should be done for other chips.
257
258    More could be done here to set up the registers as if a CPU reset had
259    occurred; hopefully real BIOSs don't assume much. */
260 static const unsigned char real_mode_switch [] =
261 {
262         0x66, 0x0f, 0x20, 0xc0,                 /*    movl  %cr0,%eax        */
263         0x66, 0x83, 0xe0, 0x11,                 /*    andl  $0x00000011,%eax */
264         0x66, 0x0d, 0x00, 0x00, 0x00, 0x60,     /*    orl   $0x60000000,%eax */
265         0x66, 0x0f, 0x22, 0xc0,                 /*    movl  %eax,%cr0        */
266         0x66, 0x0f, 0x22, 0xd8,                 /*    movl  %eax,%cr3        */
267         0x66, 0x0f, 0x20, 0xc3,                 /*    movl  %cr0,%ebx        */
268         0x66, 0x81, 0xe3, 0x00, 0x00, 0x00, 0x60,       /*    andl  $0x60000000,%ebx */
269         0x74, 0x02,                             /*    jz    f                */
270         0x0f, 0x09,                             /*    wbinvd                 */
271         0x24, 0x10,                             /* f: andb  $0x10,al         */
272         0x66, 0x0f, 0x22, 0xc0                  /*    movl  %eax,%cr0        */
273 };
274 static const unsigned char jump_to_bios [] =
275 {
276         0xea, 0x00, 0x00, 0xff, 0xff            /*    ljmp  $0xffff,$0x0000  */
277 };
278
279 /*
280  * Switch to real mode and then execute the code
281  * specified by the code and length parameters.
282  * We assume that length will aways be less that 100!
283  */
284 void machine_real_restart(const unsigned char *code, int length)
285 {
286         local_irq_disable();
287
288         /* Write zero to CMOS register number 0x0f, which the BIOS POST
289            routine will recognize as telling it to do a proper reboot.  (Well
290            that's what this book in front of me says -- it may only apply to
291            the Phoenix BIOS though, it's not clear).  At the same time,
292            disable NMIs by setting the top bit in the CMOS address register,
293            as we're about to do peculiar things to the CPU.  I'm not sure if
294            `outb_p' is needed instead of just `outb'.  Use it to be on the
295            safe side.  (Yes, CMOS_WRITE does outb_p's. -  Paul G.)
296          */
297         spin_lock(&rtc_lock);
298         CMOS_WRITE(0x00, 0x8f);
299         spin_unlock(&rtc_lock);
300
301         /* Remap the kernel at virtual address zero, as well as offset zero
302            from the kernel segment.  This assumes the kernel segment starts at
303            virtual address PAGE_OFFSET. */
304         memcpy(swapper_pg_dir, swapper_pg_dir + KERNEL_PGD_BOUNDARY,
305                 sizeof(swapper_pg_dir [0]) * KERNEL_PGD_PTRS);
306
307         /*
308          * Use `swapper_pg_dir' as our page directory.
309          */
310         load_cr3(swapper_pg_dir);
311
312         /* Write 0x1234 to absolute memory location 0x472.  The BIOS reads
313            this on booting to tell it to "Bypass memory test (also warm
314            boot)".  This seems like a fairly standard thing that gets set by
315            REBOOT.COM programs, and the previous reset routine did this
316            too. */
317         *((unsigned short *)0x472) = reboot_mode;
318
319         /* For the switch to real mode, copy some code to low memory.  It has
320            to be in the first 64k because it is running in 16-bit mode, and it
321            has to have the same physical and virtual address, because it turns
322            off paging.  Copy it near the end of the first page, out of the way
323            of BIOS variables. */
324         memcpy((void *)(0x1000 - sizeof(real_mode_switch) - 100),
325                 real_mode_switch, sizeof (real_mode_switch));
326         memcpy((void *)(0x1000 - 100), code, length);
327
328         /* Set up the IDT for real mode. */
329         load_idt(&real_mode_idt);
330
331         /* Set up a GDT from which we can load segment descriptors for real
332            mode.  The GDT is not used in real mode; it is just needed here to
333            prepare the descriptors. */
334         load_gdt(&real_mode_gdt);
335
336         /* Load the data segment registers, and thus the descriptors ready for
337            real mode.  The base address of each segment is 0x100, 16 times the
338            selector value being loaded here.  This is so that the segment
339            registers don't have to be reloaded after switching to real mode:
340            the values are consistent for real mode operation already. */
341         __asm__ __volatile__ ("movl $0x0010,%%eax\n"
342                                 "\tmovl %%eax,%%ds\n"
343                                 "\tmovl %%eax,%%es\n"
344                                 "\tmovl %%eax,%%fs\n"
345                                 "\tmovl %%eax,%%gs\n"
346                                 "\tmovl %%eax,%%ss" : : : "eax");
347
348         /* Jump to the 16-bit code that we copied earlier.  It disables paging
349            and the cache, switches to real mode, and jumps to the BIOS reset
350            entry point. */
351         __asm__ __volatile__ ("ljmp $0x0008,%0"
352                                 :
353                                 : "i" ((void *)(0x1000 - sizeof (real_mode_switch) - 100)));
354 }
355 #ifdef CONFIG_APM_MODULE
356 EXPORT_SYMBOL(machine_real_restart);
357 #endif
358
359 #endif /* CONFIG_X86_32 */
360
361 static inline void kb_wait(void)
362 {
363         int i;
364
365         for (i = 0; i < 0x10000; i++) {
366                 if ((inb(0x64) & 0x02) == 0)
367                         break;
368                 udelay(2);
369         }
370 }
371
372 void __attribute__((weak)) mach_reboot_fixups(void)
373 {
374 }
375
376 static void native_machine_emergency_restart(void)
377 {
378         int i;
379
380         /* Tell the BIOS if we want cold or warm reboot */
381         *((unsigned short *)__va(0x472)) = reboot_mode;
382
383         for (;;) {
384                 /* Could also try the reset bit in the Hammer NB */
385                 switch (reboot_type) {
386                 case BOOT_KBD:
387                         mach_reboot_fixups(); /* for board specific fixups */
388
389                         for (i = 0; i < 10; i++) {
390                                 kb_wait();
391                                 udelay(50);
392                                 outb(0xfe, 0x64); /* pulse reset low */
393                                 udelay(50);
394                         }
395
396                 case BOOT_TRIPLE:
397                         load_idt(&no_idt);
398                         __asm__ __volatile__("int3");
399
400                         reboot_type = BOOT_KBD;
401                         break;
402
403 #ifdef CONFIG_X86_32
404                 case BOOT_BIOS:
405                         machine_real_restart(jump_to_bios, sizeof(jump_to_bios));
406
407                         reboot_type = BOOT_KBD;
408                         break;
409 #endif
410
411                 case BOOT_ACPI:
412                         acpi_reboot();
413                         reboot_type = BOOT_KBD;
414                         break;
415
416                 case BOOT_EFI:
417                         if (efi_enabled)
418                                 efi.reset_system(reboot_mode ?
419                                                  EFI_RESET_WARM :
420                                                  EFI_RESET_COLD,
421                                                  EFI_SUCCESS, 0, NULL);
422                         reboot_type = BOOT_KBD;
423                         break;
424
425                 case BOOT_CF9:
426                         port_cf9_safe = true;
427                         /* fall through */
428
429                 case BOOT_CF9_COND:
430                         if (port_cf9_safe) {
431                                 u8 cf9 = inb(0xcf9) & ~6;
432                                 outb(cf9|2, 0xcf9); /* Request hard reset */
433                                 udelay(50);
434                                 outb(cf9|6, 0xcf9); /* Actually do the reset */
435                                 udelay(50);
436                         }
437                         reboot_type = BOOT_KBD;
438                         break;
439                 }
440         }
441 }
442
443 void native_machine_shutdown(void)
444 {
445         /* Stop the cpus and apics */
446 #ifdef CONFIG_SMP
447
448         /* The boot cpu is always logical cpu 0 */
449         int reboot_cpu_id = 0;
450
451 #ifdef CONFIG_X86_32
452         /* See if there has been given a command line override */
453         if ((reboot_cpu != -1) && (reboot_cpu < NR_CPUS) &&
454                 cpu_online(reboot_cpu))
455                 reboot_cpu_id = reboot_cpu;
456 #endif
457
458         /* Make certain the cpu I'm about to reboot on is online */
459         if (!cpu_online(reboot_cpu_id))
460                 reboot_cpu_id = smp_processor_id();
461
462         /* Make certain I only run on the appropriate processor */
463         set_cpus_allowed_ptr(current, &cpumask_of_cpu(reboot_cpu_id));
464
465         /* O.K Now that I'm on the appropriate processor,
466          * stop all of the others.
467          */
468         smp_send_stop();
469 #endif
470
471         lapic_shutdown();
472
473 #ifdef CONFIG_X86_IO_APIC
474         disable_IO_APIC();
475 #endif
476
477 #ifdef CONFIG_HPET_TIMER
478         hpet_disable();
479 #endif
480
481 #ifdef CONFIG_X86_64
482         pci_iommu_shutdown();
483 #endif
484 }
485
486 static void native_machine_restart(char *__unused)
487 {
488         printk("machine restart\n");
489
490         if (!reboot_force)
491                 machine_shutdown();
492         machine_emergency_restart();
493 }
494
495 static void native_machine_halt(void)
496 {
497         /* stop other cpus and apics */
498         machine_shutdown();
499
500         /* stop this cpu */
501         stop_this_cpu(NULL);
502 }
503
504 static void native_machine_power_off(void)
505 {
506         if (pm_power_off) {
507                 if (!reboot_force)
508                         machine_shutdown();
509                 pm_power_off();
510         }
511 }
512
513 struct machine_ops machine_ops = {
514         .power_off = native_machine_power_off,
515         .shutdown = native_machine_shutdown,
516         .emergency_restart = native_machine_emergency_restart,
517         .restart = native_machine_restart,
518         .halt = native_machine_halt,
519 #ifdef CONFIG_KEXEC
520         .crash_shutdown = native_machine_crash_shutdown,
521 #endif
522 };
523
524 void machine_power_off(void)
525 {
526         machine_ops.power_off();
527 }
528
529 void machine_shutdown(void)
530 {
531         machine_ops.shutdown();
532 }
533
534 void machine_emergency_restart(void)
535 {
536         machine_ops.emergency_restart();
537 }
538
539 void machine_restart(char *cmd)
540 {
541         machine_ops.restart(cmd);
542 }
543
544 void machine_halt(void)
545 {
546         machine_ops.halt();
547 }
548
549 #ifdef CONFIG_KEXEC
550 void machine_crash_shutdown(struct pt_regs *regs)
551 {
552         machine_ops.crash_shutdown(regs);
553 }
554 #endif
555
556
557 #if defined(CONFIG_SMP)
558
559 /* This keeps a track of which one is crashing cpu. */
560 static int crashing_cpu;
561 static nmi_shootdown_cb shootdown_callback;
562
563 static atomic_t waiting_for_crash_ipi;
564
565 static int crash_nmi_callback(struct notifier_block *self,
566                         unsigned long val, void *data)
567 {
568         int cpu;
569
570         if (val != DIE_NMI_IPI)
571                 return NOTIFY_OK;
572
573         cpu = raw_smp_processor_id();
574
575         /* Don't do anything if this handler is invoked on crashing cpu.
576          * Otherwise, system will completely hang. Crashing cpu can get
577          * an NMI if system was initially booted with nmi_watchdog parameter.
578          */
579         if (cpu == crashing_cpu)
580                 return NOTIFY_STOP;
581         local_irq_disable();
582
583         shootdown_callback(cpu, (struct die_args *)data);
584
585         atomic_dec(&waiting_for_crash_ipi);
586         /* Assume hlt works */
587         halt();
588         for (;;)
589                 cpu_relax();
590
591         return 1;
592 }
593
594 static void smp_send_nmi_allbutself(void)
595 {
596         cpumask_t mask = cpu_online_map;
597         cpu_clear(safe_smp_processor_id(), mask);
598         if (!cpus_empty(mask))
599                 send_IPI_mask(mask, NMI_VECTOR);
600 }
601
602 static struct notifier_block crash_nmi_nb = {
603         .notifier_call = crash_nmi_callback,
604 };
605
606 /* Halt all other CPUs, calling the specified function on each of them
607  *
608  * This function can be used to halt all other CPUs on crash
609  * or emergency reboot time. The function passed as parameter
610  * will be called inside a NMI handler on all CPUs.
611  */
612 void nmi_shootdown_cpus(nmi_shootdown_cb callback)
613 {
614         unsigned long msecs;
615         local_irq_disable();
616
617         /* Make a note of crashing cpu. Will be used in NMI callback.*/
618         crashing_cpu = safe_smp_processor_id();
619
620         shootdown_callback = callback;
621
622         atomic_set(&waiting_for_crash_ipi, num_online_cpus() - 1);
623         /* Would it be better to replace the trap vector here? */
624         if (register_die_notifier(&crash_nmi_nb))
625                 return;         /* return what? */
626         /* Ensure the new callback function is set before sending
627          * out the NMI
628          */
629         wmb();
630
631         smp_send_nmi_allbutself();
632
633         msecs = 1000; /* Wait at most a second for the other cpus to stop */
634         while ((atomic_read(&waiting_for_crash_ipi) > 0) && msecs) {
635                 mdelay(1);
636                 msecs--;
637         }
638
639         /* Leave the nmi callback set */
640 }
641 #else /* !CONFIG_SMP */
642 void nmi_shootdown_cpus(nmi_shootdown_cb callback)
643 {
644         /* No other CPUs to shoot down */
645 }
646 #endif