[PATCH] x86-64: Don't assign CPU numbers in SRAT parsing
[linux-2.6.git] / arch / x86_64 / kernel / setup.c
1 /*
2  *  linux/arch/x86-64/kernel/setup.c
3  *
4  *  Copyright (C) 1995  Linus Torvalds
5  *
6  *  Nov 2001 Dave Jones <davej@suse.de>
7  *  Forked from i386 setup code.
8  *
9  *  $Id$
10  */
11
12 /*
13  * This file handles the architecture-dependent parts of initialization
14  */
15
16 #include <linux/errno.h>
17 #include <linux/sched.h>
18 #include <linux/kernel.h>
19 #include <linux/mm.h>
20 #include <linux/stddef.h>
21 #include <linux/unistd.h>
22 #include <linux/ptrace.h>
23 #include <linux/slab.h>
24 #include <linux/user.h>
25 #include <linux/a.out.h>
26 #include <linux/tty.h>
27 #include <linux/ioport.h>
28 #include <linux/delay.h>
29 #include <linux/config.h>
30 #include <linux/init.h>
31 #include <linux/initrd.h>
32 #include <linux/highmem.h>
33 #include <linux/bootmem.h>
34 #include <linux/module.h>
35 #include <asm/processor.h>
36 #include <linux/console.h>
37 #include <linux/seq_file.h>
38 #include <linux/root_dev.h>
39 #include <linux/pci.h>
40 #include <linux/acpi.h>
41 #include <linux/kallsyms.h>
42 #include <linux/edd.h>
43 #include <linux/mmzone.h>
44 #include <linux/kexec.h>
45
46 #include <asm/mtrr.h>
47 #include <asm/uaccess.h>
48 #include <asm/system.h>
49 #include <asm/io.h>
50 #include <asm/smp.h>
51 #include <asm/msr.h>
52 #include <asm/desc.h>
53 #include <video/edid.h>
54 #include <asm/e820.h>
55 #include <asm/dma.h>
56 #include <asm/mpspec.h>
57 #include <asm/mmu_context.h>
58 #include <asm/bootsetup.h>
59 #include <asm/proto.h>
60 #include <asm/setup.h>
61 #include <asm/mach_apic.h>
62 #include <asm/numa.h>
63
64 /*
65  * Machine setup..
66  */
67
68 struct cpuinfo_x86 boot_cpu_data __read_mostly;
69
70 unsigned long mmu_cr4_features;
71
72 int acpi_disabled;
73 EXPORT_SYMBOL(acpi_disabled);
74 #ifdef  CONFIG_ACPI
75 extern int __initdata acpi_ht;
76 extern acpi_interrupt_flags     acpi_sci_flags;
77 int __initdata acpi_force = 0;
78 #endif
79
80 int acpi_numa __initdata;
81
82 /* Boot loader ID as an integer, for the benefit of proc_dointvec */
83 int bootloader_type;
84
85 unsigned long saved_video_mode;
86
87 #ifdef CONFIG_SWIOTLB
88 int swiotlb;
89 EXPORT_SYMBOL(swiotlb);
90 #endif
91
92 /*
93  * Setup options
94  */
95 struct drive_info_struct { char dummy[32]; } drive_info;
96 struct screen_info screen_info;
97 struct sys_desc_table_struct {
98         unsigned short length;
99         unsigned char table[0];
100 };
101
102 struct edid_info edid_info;
103 struct e820map e820;
104
105 extern int root_mountflags;
106 extern char _text, _etext, _edata, _end;
107
108 char command_line[COMMAND_LINE_SIZE];
109
110 struct resource standard_io_resources[] = {
111         { .name = "dma1", .start = 0x00, .end = 0x1f,
112                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
113         { .name = "pic1", .start = 0x20, .end = 0x21,
114                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
115         { .name = "timer0", .start = 0x40, .end = 0x43,
116                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
117         { .name = "timer1", .start = 0x50, .end = 0x53,
118                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
119         { .name = "keyboard", .start = 0x60, .end = 0x6f,
120                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
121         { .name = "dma page reg", .start = 0x80, .end = 0x8f,
122                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
123         { .name = "pic2", .start = 0xa0, .end = 0xa1,
124                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
125         { .name = "dma2", .start = 0xc0, .end = 0xdf,
126                 .flags = IORESOURCE_BUSY | IORESOURCE_IO },
127         { .name = "fpu", .start = 0xf0, .end = 0xff,
128                 .flags = IORESOURCE_BUSY | IORESOURCE_IO }
129 };
130
131 #define STANDARD_IO_RESOURCES \
132         (sizeof standard_io_resources / sizeof standard_io_resources[0])
133
134 #define IORESOURCE_RAM (IORESOURCE_BUSY | IORESOURCE_MEM)
135
136 struct resource data_resource = {
137         .name = "Kernel data",
138         .start = 0,
139         .end = 0,
140         .flags = IORESOURCE_RAM,
141 };
142 struct resource code_resource = {
143         .name = "Kernel code",
144         .start = 0,
145         .end = 0,
146         .flags = IORESOURCE_RAM,
147 };
148
149 #define IORESOURCE_ROM (IORESOURCE_BUSY | IORESOURCE_READONLY | IORESOURCE_MEM)
150
151 static struct resource system_rom_resource = {
152         .name = "System ROM",
153         .start = 0xf0000,
154         .end = 0xfffff,
155         .flags = IORESOURCE_ROM,
156 };
157
158 static struct resource extension_rom_resource = {
159         .name = "Extension ROM",
160         .start = 0xe0000,
161         .end = 0xeffff,
162         .flags = IORESOURCE_ROM,
163 };
164
165 static struct resource adapter_rom_resources[] = {
166         { .name = "Adapter ROM", .start = 0xc8000, .end = 0,
167                 .flags = IORESOURCE_ROM },
168         { .name = "Adapter ROM", .start = 0, .end = 0,
169                 .flags = IORESOURCE_ROM },
170         { .name = "Adapter ROM", .start = 0, .end = 0,
171                 .flags = IORESOURCE_ROM },
172         { .name = "Adapter ROM", .start = 0, .end = 0,
173                 .flags = IORESOURCE_ROM },
174         { .name = "Adapter ROM", .start = 0, .end = 0,
175                 .flags = IORESOURCE_ROM },
176         { .name = "Adapter ROM", .start = 0, .end = 0,
177                 .flags = IORESOURCE_ROM }
178 };
179
180 #define ADAPTER_ROM_RESOURCES \
181         (sizeof adapter_rom_resources / sizeof adapter_rom_resources[0])
182
183 static struct resource video_rom_resource = {
184         .name = "Video ROM",
185         .start = 0xc0000,
186         .end = 0xc7fff,
187         .flags = IORESOURCE_ROM,
188 };
189
190 static struct resource video_ram_resource = {
191         .name = "Video RAM area",
192         .start = 0xa0000,
193         .end = 0xbffff,
194         .flags = IORESOURCE_RAM,
195 };
196
197 #define romsignature(x) (*(unsigned short *)(x) == 0xaa55)
198
199 static int __init romchecksum(unsigned char *rom, unsigned long length)
200 {
201         unsigned char *p, sum = 0;
202
203         for (p = rom; p < rom + length; p++)
204                 sum += *p;
205         return sum == 0;
206 }
207
208 static void __init probe_roms(void)
209 {
210         unsigned long start, length, upper;
211         unsigned char *rom;
212         int           i;
213
214         /* video rom */
215         upper = adapter_rom_resources[0].start;
216         for (start = video_rom_resource.start; start < upper; start += 2048) {
217                 rom = isa_bus_to_virt(start);
218                 if (!romsignature(rom))
219                         continue;
220
221                 video_rom_resource.start = start;
222
223                 /* 0 < length <= 0x7f * 512, historically */
224                 length = rom[2] * 512;
225
226                 /* if checksum okay, trust length byte */
227                 if (length && romchecksum(rom, length))
228                         video_rom_resource.end = start + length - 1;
229
230                 request_resource(&iomem_resource, &video_rom_resource);
231                 break;
232                         }
233
234         start = (video_rom_resource.end + 1 + 2047) & ~2047UL;
235         if (start < upper)
236                 start = upper;
237
238         /* system rom */
239         request_resource(&iomem_resource, &system_rom_resource);
240         upper = system_rom_resource.start;
241
242         /* check for extension rom (ignore length byte!) */
243         rom = isa_bus_to_virt(extension_rom_resource.start);
244         if (romsignature(rom)) {
245                 length = extension_rom_resource.end - extension_rom_resource.start + 1;
246                 if (romchecksum(rom, length)) {
247                         request_resource(&iomem_resource, &extension_rom_resource);
248                         upper = extension_rom_resource.start;
249                 }
250         }
251
252         /* check for adapter roms on 2k boundaries */
253         for (i = 0; i < ADAPTER_ROM_RESOURCES && start < upper; start += 2048) {
254                 rom = isa_bus_to_virt(start);
255                 if (!romsignature(rom))
256                         continue;
257
258                 /* 0 < length <= 0x7f * 512, historically */
259                 length = rom[2] * 512;
260
261                 /* but accept any length that fits if checksum okay */
262                 if (!length || start + length > upper || !romchecksum(rom, length))
263                         continue;
264
265                 adapter_rom_resources[i].start = start;
266                 adapter_rom_resources[i].end = start + length - 1;
267                 request_resource(&iomem_resource, &adapter_rom_resources[i]);
268
269                 start = adapter_rom_resources[i++].end & ~2047UL;
270         }
271 }
272
273 static __init void parse_cmdline_early (char ** cmdline_p)
274 {
275         char c = ' ', *to = command_line, *from = COMMAND_LINE;
276         int len = 0;
277
278         /* Save unparsed command line copy for /proc/cmdline */
279         memcpy(saved_command_line, COMMAND_LINE, COMMAND_LINE_SIZE);
280         saved_command_line[COMMAND_LINE_SIZE-1] = '\0';
281
282         for (;;) {
283                 if (c != ' ') 
284                         goto next_char; 
285
286 #ifdef  CONFIG_SMP
287                 /*
288                  * If the BIOS enumerates physical processors before logical,
289                  * maxcpus=N at enumeration-time can be used to disable HT.
290                  */
291                 else if (!memcmp(from, "maxcpus=", 8)) {
292                         extern unsigned int maxcpus;
293
294                         maxcpus = simple_strtoul(from + 8, NULL, 0);
295                 }
296 #endif
297 #ifdef CONFIG_ACPI
298                 /* "acpi=off" disables both ACPI table parsing and interpreter init */
299                 if (!memcmp(from, "acpi=off", 8))
300                         disable_acpi();
301
302                 if (!memcmp(from, "acpi=force", 10)) { 
303                         /* add later when we do DMI horrors: */
304                         acpi_force = 1;
305                         acpi_disabled = 0;
306                 }
307
308                 /* acpi=ht just means: do ACPI MADT parsing 
309                    at bootup, but don't enable the full ACPI interpreter */
310                 if (!memcmp(from, "acpi=ht", 7)) { 
311                         if (!acpi_force)
312                                 disable_acpi();
313                         acpi_ht = 1; 
314                 }
315                 else if (!memcmp(from, "pci=noacpi", 10)) 
316                         acpi_disable_pci();
317                 else if (!memcmp(from, "acpi=noirq", 10))
318                         acpi_noirq_set();
319
320                 else if (!memcmp(from, "acpi_sci=edge", 13))
321                         acpi_sci_flags.trigger =  1;
322                 else if (!memcmp(from, "acpi_sci=level", 14))
323                         acpi_sci_flags.trigger = 3;
324                 else if (!memcmp(from, "acpi_sci=high", 13))
325                         acpi_sci_flags.polarity = 1;
326                 else if (!memcmp(from, "acpi_sci=low", 12))
327                         acpi_sci_flags.polarity = 3;
328
329                 /* acpi=strict disables out-of-spec workarounds */
330                 else if (!memcmp(from, "acpi=strict", 11)) {
331                         acpi_strict = 1;
332                 }
333 #ifdef CONFIG_X86_IO_APIC
334                 else if (!memcmp(from, "acpi_skip_timer_override", 24))
335                         acpi_skip_timer_override = 1;
336 #endif
337 #endif
338
339                 if (!memcmp(from, "nolapic", 7) ||
340                     !memcmp(from, "disableapic", 11))
341                         disable_apic = 1;
342
343                 if (!memcmp(from, "noapic", 6)) 
344                         skip_ioapic_setup = 1;
345
346                 if (!memcmp(from, "apic", 4)) { 
347                         skip_ioapic_setup = 0;
348                         ioapic_force = 1;
349                 }
350                         
351                 if (!memcmp(from, "mem=", 4))
352                         parse_memopt(from+4, &from); 
353
354 #ifdef CONFIG_NUMA
355                 if (!memcmp(from, "numa=", 5))
356                         numa_setup(from+5); 
357 #endif
358
359 #ifdef CONFIG_GART_IOMMU 
360                 if (!memcmp(from,"iommu=",6)) { 
361                         iommu_setup(from+6); 
362                 }
363 #endif
364
365                 if (!memcmp(from,"oops=panic", 10))
366                         panic_on_oops = 1;
367
368                 if (!memcmp(from, "noexec=", 7))
369                         nonx_setup(from + 7);
370
371 #ifdef CONFIG_KEXEC
372                 /* crashkernel=size@addr specifies the location to reserve for
373                  * a crash kernel.  By reserving this memory we guarantee
374                  * that linux never set's it up as a DMA target.
375                  * Useful for holding code to do something appropriate
376                  * after a kernel panic.
377                  */
378                 else if (!memcmp(from, "crashkernel=", 12)) {
379                         unsigned long size, base;
380                         size = memparse(from+12, &from);
381                         if (*from == '@') {
382                                 base = memparse(from+1, &from);
383                                 /* FIXME: Do I want a sanity check
384                                  * to validate the memory range?
385                                  */
386                                 crashk_res.start = base;
387                                 crashk_res.end   = base + size - 1;
388                         }
389                 }
390 #endif
391
392         next_char:
393                 c = *(from++);
394                 if (!c)
395                         break;
396                 if (COMMAND_LINE_SIZE <= ++len)
397                         break;
398                 *(to++) = c;
399         }
400         *to = '\0';
401         *cmdline_p = command_line;
402 }
403
404 #ifndef CONFIG_NUMA
405 static void __init
406 contig_initmem_init(unsigned long start_pfn, unsigned long end_pfn)
407 {
408         unsigned long bootmap_size, bootmap;
409
410         memory_present(0, start_pfn, end_pfn);
411         bootmap_size = bootmem_bootmap_pages(end_pfn)<<PAGE_SHIFT;
412         bootmap = find_e820_area(0, end_pfn<<PAGE_SHIFT, bootmap_size);
413         if (bootmap == -1L)
414                 panic("Cannot find bootmem map of size %ld\n",bootmap_size);
415         bootmap_size = init_bootmem(bootmap >> PAGE_SHIFT, end_pfn);
416         e820_bootmem_free(NODE_DATA(0), 0, end_pfn << PAGE_SHIFT);
417         reserve_bootmem(bootmap, bootmap_size);
418
419 #endif
420
421 /* Use inline assembly to define this because the nops are defined 
422    as inline assembly strings in the include files and we cannot 
423    get them easily into strings. */
424 asm("\t.data\nk8nops: " 
425     K8_NOP1 K8_NOP2 K8_NOP3 K8_NOP4 K8_NOP5 K8_NOP6
426     K8_NOP7 K8_NOP8); 
427     
428 extern unsigned char k8nops[];
429 static unsigned char *k8_nops[ASM_NOP_MAX+1] = { 
430      NULL,
431      k8nops,
432      k8nops + 1,
433      k8nops + 1 + 2,
434      k8nops + 1 + 2 + 3,
435      k8nops + 1 + 2 + 3 + 4,
436      k8nops + 1 + 2 + 3 + 4 + 5,
437      k8nops + 1 + 2 + 3 + 4 + 5 + 6,
438      k8nops + 1 + 2 + 3 + 4 + 5 + 6 + 7,
439 }; 
440
441 /* Replace instructions with better alternatives for this CPU type.
442
443    This runs before SMP is initialized to avoid SMP problems with
444    self modifying code. This implies that assymetric systems where
445    APs have less capabilities than the boot processor are not handled. 
446    In this case boot with "noreplacement". */ 
447 void apply_alternatives(void *start, void *end) 
448
449         struct alt_instr *a; 
450         int diff, i, k;
451         for (a = start; (void *)a < end; a++) { 
452                 if (!boot_cpu_has(a->cpuid))
453                         continue;
454
455                 BUG_ON(a->replacementlen > a->instrlen); 
456                 __inline_memcpy(a->instr, a->replacement, a->replacementlen); 
457                 diff = a->instrlen - a->replacementlen; 
458
459                 /* Pad the rest with nops */
460                 for (i = a->replacementlen; diff > 0; diff -= k, i += k) {
461                         k = diff;
462                         if (k > ASM_NOP_MAX)
463                                 k = ASM_NOP_MAX;
464                         __inline_memcpy(a->instr + i, k8_nops[k], k); 
465                 } 
466         }
467
468
469 static int no_replacement __initdata = 0; 
470  
471 void __init alternative_instructions(void)
472 {
473         extern struct alt_instr __alt_instructions[], __alt_instructions_end[];
474         if (no_replacement) 
475                 return;
476         apply_alternatives(__alt_instructions, __alt_instructions_end);
477 }
478
479 static int __init noreplacement_setup(char *s)
480
481      no_replacement = 1; 
482      return 0; 
483
484
485 __setup("noreplacement", noreplacement_setup); 
486
487 #if defined(CONFIG_EDD) || defined(CONFIG_EDD_MODULE)
488 struct edd edd;
489 #ifdef CONFIG_EDD_MODULE
490 EXPORT_SYMBOL(edd);
491 #endif
492 /**
493  * copy_edd() - Copy the BIOS EDD information
494  *              from boot_params into a safe place.
495  *
496  */
497 static inline void copy_edd(void)
498 {
499      memcpy(edd.mbr_signature, EDD_MBR_SIGNATURE, sizeof(edd.mbr_signature));
500      memcpy(edd.edd_info, EDD_BUF, sizeof(edd.edd_info));
501      edd.mbr_signature_nr = EDD_MBR_SIG_NR;
502      edd.edd_info_nr = EDD_NR;
503 }
504 #else
505 static inline void copy_edd(void)
506 {
507 }
508 #endif
509
510 #define EBDA_ADDR_POINTER 0x40E
511 static void __init reserve_ebda_region(void)
512 {
513         unsigned int addr;
514         /** 
515          * there is a real-mode segmented pointer pointing to the 
516          * 4K EBDA area at 0x40E
517          */
518         addr = *(unsigned short *)phys_to_virt(EBDA_ADDR_POINTER);
519         addr <<= 4;
520         if (addr)
521                 reserve_bootmem_generic(addr, PAGE_SIZE);
522 }
523
524 void __init setup_arch(char **cmdline_p)
525 {
526         unsigned long kernel_end;
527
528         ROOT_DEV = old_decode_dev(ORIG_ROOT_DEV);
529         drive_info = DRIVE_INFO;
530         screen_info = SCREEN_INFO;
531         edid_info = EDID_INFO;
532         saved_video_mode = SAVED_VIDEO_MODE;
533         bootloader_type = LOADER_TYPE;
534
535 #ifdef CONFIG_BLK_DEV_RAM
536         rd_image_start = RAMDISK_FLAGS & RAMDISK_IMAGE_START_MASK;
537         rd_prompt = ((RAMDISK_FLAGS & RAMDISK_PROMPT_FLAG) != 0);
538         rd_doload = ((RAMDISK_FLAGS & RAMDISK_LOAD_FLAG) != 0);
539 #endif
540         setup_memory_region();
541         copy_edd();
542
543         if (!MOUNT_ROOT_RDONLY)
544                 root_mountflags &= ~MS_RDONLY;
545         init_mm.start_code = (unsigned long) &_text;
546         init_mm.end_code = (unsigned long) &_etext;
547         init_mm.end_data = (unsigned long) &_edata;
548         init_mm.brk = (unsigned long) &_end;
549
550         code_resource.start = virt_to_phys(&_text);
551         code_resource.end = virt_to_phys(&_etext)-1;
552         data_resource.start = virt_to_phys(&_etext);
553         data_resource.end = virt_to_phys(&_edata)-1;
554
555         parse_cmdline_early(cmdline_p);
556
557         early_identify_cpu(&boot_cpu_data);
558
559         /*
560          * partially used pages are not usable - thus
561          * we are rounding upwards:
562          */
563         end_pfn = e820_end_of_ram();
564
565         check_efer();
566
567         init_memory_mapping(0, (end_pfn_map << PAGE_SHIFT));
568
569 #ifdef CONFIG_ACPI
570         /*
571          * Initialize the ACPI boot-time table parser (gets the RSDP and SDT).
572          * Call this early for SRAT node setup.
573          */
574         acpi_boot_table_init();
575 #endif
576
577 #ifdef CONFIG_ACPI_NUMA
578         /*
579          * Parse SRAT to discover nodes.
580          */
581         acpi_numa_init();
582 #endif
583
584 #ifdef CONFIG_NUMA
585         numa_initmem_init(0, end_pfn); 
586 #else
587         contig_initmem_init(0, end_pfn);
588 #endif
589
590         /* Reserve direct mapping */
591         reserve_bootmem_generic(table_start << PAGE_SHIFT, 
592                                 (table_end - table_start) << PAGE_SHIFT);
593
594         /* reserve kernel */
595         kernel_end = round_up(__pa_symbol(&_end),PAGE_SIZE);
596         reserve_bootmem_generic(HIGH_MEMORY, kernel_end - HIGH_MEMORY);
597
598         /*
599          * reserve physical page 0 - it's a special BIOS page on many boxes,
600          * enabling clean reboots, SMP operation, laptop functions.
601          */
602         reserve_bootmem_generic(0, PAGE_SIZE);
603
604         /* reserve ebda region */
605         reserve_ebda_region();
606
607 #ifdef CONFIG_SMP
608         /*
609          * But first pinch a few for the stack/trampoline stuff
610          * FIXME: Don't need the extra page at 4K, but need to fix
611          * trampoline before removing it. (see the GDT stuff)
612          */
613         reserve_bootmem_generic(PAGE_SIZE, PAGE_SIZE);
614
615         /* Reserve SMP trampoline */
616         reserve_bootmem_generic(SMP_TRAMPOLINE_BASE, PAGE_SIZE);
617 #endif
618
619 #ifdef CONFIG_ACPI_SLEEP
620        /*
621         * Reserve low memory region for sleep support.
622         */
623        acpi_reserve_bootmem();
624 #endif
625 #ifdef CONFIG_X86_LOCAL_APIC
626         /*
627          * Find and reserve possible boot-time SMP configuration:
628          */
629         find_smp_config();
630 #endif
631 #ifdef CONFIG_BLK_DEV_INITRD
632         if (LOADER_TYPE && INITRD_START) {
633                 if (INITRD_START + INITRD_SIZE <= (end_pfn << PAGE_SHIFT)) {
634                         reserve_bootmem_generic(INITRD_START, INITRD_SIZE);
635                         initrd_start =
636                                 INITRD_START ? INITRD_START + PAGE_OFFSET : 0;
637                         initrd_end = initrd_start+INITRD_SIZE;
638                 }
639                 else {
640                         printk(KERN_ERR "initrd extends beyond end of memory "
641                             "(0x%08lx > 0x%08lx)\ndisabling initrd\n",
642                             (unsigned long)(INITRD_START + INITRD_SIZE),
643                             (unsigned long)(end_pfn << PAGE_SHIFT));
644                         initrd_start = 0;
645                 }
646         }
647 #endif
648 #ifdef CONFIG_KEXEC
649         if (crashk_res.start != crashk_res.end) {
650                 reserve_bootmem(crashk_res.start,
651                         crashk_res.end - crashk_res.start + 1);
652         }
653 #endif
654
655         sparse_init();
656
657         paging_init();
658
659         check_ioapic();
660
661 #ifdef CONFIG_ACPI
662         /*
663          * Read APIC and some other early information from ACPI tables.
664          */
665         acpi_boot_init();
666 #endif
667
668 #ifdef CONFIG_X86_LOCAL_APIC
669         /*
670          * get boot-time SMP configuration:
671          */
672         if (smp_found_config)
673                 get_smp_config();
674         init_apic_mappings();
675 #endif
676
677         /*
678          * Request address space for all standard RAM and ROM resources
679          * and also for regions reported as reserved by the e820.
680          */
681         probe_roms();
682         e820_reserve_resources(); 
683
684         request_resource(&iomem_resource, &video_ram_resource);
685
686         {
687         unsigned i;
688         /* request I/O space for devices used on all i[345]86 PCs */
689         for (i = 0; i < STANDARD_IO_RESOURCES; i++)
690                 request_resource(&ioport_resource, &standard_io_resources[i]);
691         }
692
693         e820_setup_gap();
694
695 #ifdef CONFIG_GART_IOMMU
696        iommu_hole_init();
697 #endif
698
699 #ifdef CONFIG_VT
700 #if defined(CONFIG_VGA_CONSOLE)
701         conswitchp = &vga_con;
702 #elif defined(CONFIG_DUMMY_CONSOLE)
703         conswitchp = &dummy_con;
704 #endif
705 #endif
706 }
707
708 static int __cpuinit get_model_name(struct cpuinfo_x86 *c)
709 {
710         unsigned int *v;
711
712         if (c->extended_cpuid_level < 0x80000004)
713                 return 0;
714
715         v = (unsigned int *) c->x86_model_id;
716         cpuid(0x80000002, &v[0], &v[1], &v[2], &v[3]);
717         cpuid(0x80000003, &v[4], &v[5], &v[6], &v[7]);
718         cpuid(0x80000004, &v[8], &v[9], &v[10], &v[11]);
719         c->x86_model_id[48] = 0;
720         return 1;
721 }
722
723
724 static void __cpuinit display_cacheinfo(struct cpuinfo_x86 *c)
725 {
726         unsigned int n, dummy, eax, ebx, ecx, edx;
727
728         n = c->extended_cpuid_level;
729
730         if (n >= 0x80000005) {
731                 cpuid(0x80000005, &dummy, &ebx, &ecx, &edx);
732                 printk(KERN_INFO "CPU: L1 I Cache: %dK (%d bytes/line), D cache %dK (%d bytes/line)\n",
733                         edx>>24, edx&0xFF, ecx>>24, ecx&0xFF);
734                 c->x86_cache_size=(ecx>>24)+(edx>>24);
735                 /* On K8 L1 TLB is inclusive, so don't count it */
736                 c->x86_tlbsize = 0;
737         }
738
739         if (n >= 0x80000006) {
740                 cpuid(0x80000006, &dummy, &ebx, &ecx, &edx);
741                 ecx = cpuid_ecx(0x80000006);
742                 c->x86_cache_size = ecx >> 16;
743                 c->x86_tlbsize += ((ebx >> 16) & 0xfff) + (ebx & 0xfff);
744
745                 printk(KERN_INFO "CPU: L2 Cache: %dK (%d bytes/line)\n",
746                 c->x86_cache_size, ecx & 0xFF);
747         }
748
749         if (n >= 0x80000007)
750                 cpuid(0x80000007, &dummy, &dummy, &dummy, &c->x86_power); 
751         if (n >= 0x80000008) {
752                 cpuid(0x80000008, &eax, &dummy, &dummy, &dummy); 
753                 c->x86_virt_bits = (eax >> 8) & 0xff;
754                 c->x86_phys_bits = eax & 0xff;
755         }
756 }
757
758 /*
759  * On a AMD dual core setup the lower bits of the APIC id distingush the cores.
760  * Assumes number of cores is a power of two.
761  */
762 static void __init amd_detect_cmp(struct cpuinfo_x86 *c)
763 {
764 #ifdef CONFIG_SMP
765         int cpu = smp_processor_id();
766         int node = 0;
767         unsigned bits;
768         unsigned apicid = phys_proc_id[cpu];
769
770         bits = 0;
771         while ((1 << bits) < c->x86_num_cores)
772                 bits++;
773
774         /* Low order bits define the core id (index of core in socket) */
775         cpu_core_id[cpu] = phys_proc_id[cpu] & ((1 << bits)-1);
776         /* Convert the APIC ID into the socket ID */
777         phys_proc_id[cpu] >>= bits;
778
779 #ifdef CONFIG_NUMA
780         /* When an ACPI SRAT table is available use the mappings from SRAT
781            instead. */
782         node = phys_proc_id[cpu];
783         if (acpi_numa > 0) {
784                 if (apicid_to_node[apicid] != NUMA_NO_NODE)
785                         node = apicid_to_node[apicid];
786                 else
787                         printk(KERN_ERR
788                                "SRAT: Didn't specify node for CPU %d(%d)\n",
789                                cpu, apicid);
790         }
791         if (!node_online(node))
792                 node = first_node(node_online_map);
793         cpu_to_node[cpu] = node;
794 #endif
795
796         printk(KERN_INFO "CPU %d(%d) -> Node %d -> Core %d\n",
797                         cpu, c->x86_num_cores, node, cpu_core_id[cpu]);
798 #endif
799 }
800
801 static int __init init_amd(struct cpuinfo_x86 *c)
802 {
803         int r;
804         int level;
805
806         /* Bit 31 in normal CPUID used for nonstandard 3DNow ID;
807            3DNow is IDd by bit 31 in extended CPUID (1*32+31) anyway */
808         clear_bit(0*32+31, &c->x86_capability);
809         
810         /* C-stepping K8? */
811         level = cpuid_eax(1);
812         if ((level >= 0x0f48 && level < 0x0f50) || level >= 0x0f58)
813                 set_bit(X86_FEATURE_K8_C, &c->x86_capability);
814
815         r = get_model_name(c);
816         if (!r) { 
817                 switch (c->x86) { 
818                 case 15:
819                         /* Should distinguish Models here, but this is only
820                            a fallback anyways. */
821                         strcpy(c->x86_model_id, "Hammer");
822                         break; 
823                 } 
824         } 
825         display_cacheinfo(c);
826
827         if (c->extended_cpuid_level >= 0x80000008) {
828                 c->x86_num_cores = (cpuid_ecx(0x80000008) & 0xff) + 1;
829                 if (c->x86_num_cores & (c->x86_num_cores - 1))
830                         c->x86_num_cores = 1;
831
832                 amd_detect_cmp(c);
833         }
834
835         return r;
836 }
837
838 static void __cpuinit detect_ht(struct cpuinfo_x86 *c)
839 {
840 #ifdef CONFIG_SMP
841         u32     eax, ebx, ecx, edx;
842         int     index_msb, tmp;
843         int     cpu = smp_processor_id();
844         
845         if (!cpu_has(c, X86_FEATURE_HT) || cpu_has(c, X86_FEATURE_CMP_LEGACY))
846                 return;
847
848         cpuid(1, &eax, &ebx, &ecx, &edx);
849         smp_num_siblings = (ebx & 0xff0000) >> 16;
850         
851         if (smp_num_siblings == 1) {
852                 printk(KERN_INFO  "CPU: Hyper-Threading is disabled\n");
853         } else if (smp_num_siblings > 1) {
854                 index_msb = 31;
855                 /*
856                  * At this point we only support two siblings per
857                  * processor package.
858                  */
859                 if (smp_num_siblings > NR_CPUS) {
860                         printk(KERN_WARNING "CPU: Unsupported number of the siblings %d", smp_num_siblings);
861                         smp_num_siblings = 1;
862                         return;
863                 }
864                 tmp = smp_num_siblings;
865                 while ((tmp & 0x80000000 ) == 0) {
866                         tmp <<=1 ;
867                         index_msb--;
868                 }
869                 if (smp_num_siblings & (smp_num_siblings - 1))
870                         index_msb++;
871                 phys_proc_id[cpu] = phys_pkg_id(index_msb);
872                 
873                 printk(KERN_INFO  "CPU: Physical Processor ID: %d\n",
874                        phys_proc_id[cpu]);
875
876                 smp_num_siblings = smp_num_siblings / c->x86_num_cores;
877
878                 tmp = smp_num_siblings;
879                 index_msb = 31;
880                 while ((tmp & 0x80000000) == 0) {
881                         tmp <<=1 ;
882                         index_msb--;
883                 }
884                 if (smp_num_siblings & (smp_num_siblings - 1))
885                         index_msb++;
886
887                 cpu_core_id[cpu] = phys_pkg_id(index_msb);
888
889                 if (c->x86_num_cores > 1)
890                         printk(KERN_INFO  "CPU: Processor Core ID: %d\n",
891                                cpu_core_id[cpu]);
892         }
893 #endif
894 }
895
896 /*
897  * find out the number of processor cores on the die
898  */
899 static int __cpuinit intel_num_cpu_cores(struct cpuinfo_x86 *c)
900 {
901         unsigned int eax;
902
903         if (c->cpuid_level < 4)
904                 return 1;
905
906         __asm__("cpuid"
907                 : "=a" (eax)
908                 : "0" (4), "c" (0)
909                 : "bx", "dx");
910
911         if (eax & 0x1f)
912                 return ((eax >> 26) + 1);
913         else
914                 return 1;
915 }
916
917 static void __cpuinit init_intel(struct cpuinfo_x86 *c)
918 {
919         /* Cache sizes */
920         unsigned n;
921
922         init_intel_cacheinfo(c);
923         n = c->extended_cpuid_level;
924         if (n >= 0x80000008) {
925                 unsigned eax = cpuid_eax(0x80000008);
926                 c->x86_virt_bits = (eax >> 8) & 0xff;
927                 c->x86_phys_bits = eax & 0xff;
928         }
929
930         if (c->x86 == 15)
931                 c->x86_cache_alignment = c->x86_clflush_size * 2;
932         if (c->x86 >= 15)
933                 set_bit(X86_FEATURE_CONSTANT_TSC, &c->x86_capability);
934         c->x86_num_cores = intel_num_cpu_cores(c);
935 }
936
937 static void __cpuinit get_cpu_vendor(struct cpuinfo_x86 *c)
938 {
939         char *v = c->x86_vendor_id;
940
941         if (!strcmp(v, "AuthenticAMD"))
942                 c->x86_vendor = X86_VENDOR_AMD;
943         else if (!strcmp(v, "GenuineIntel"))
944                 c->x86_vendor = X86_VENDOR_INTEL;
945         else
946                 c->x86_vendor = X86_VENDOR_UNKNOWN;
947 }
948
949 struct cpu_model_info {
950         int vendor;
951         int family;
952         char *model_names[16];
953 };
954
955 /* Do some early cpuid on the boot CPU to get some parameter that are
956    needed before check_bugs. Everything advanced is in identify_cpu
957    below. */
958 void __cpuinit early_identify_cpu(struct cpuinfo_x86 *c)
959 {
960         u32 tfms;
961
962         c->loops_per_jiffy = loops_per_jiffy;
963         c->x86_cache_size = -1;
964         c->x86_vendor = X86_VENDOR_UNKNOWN;
965         c->x86_model = c->x86_mask = 0; /* So far unknown... */
966         c->x86_vendor_id[0] = '\0'; /* Unset */
967         c->x86_model_id[0] = '\0';  /* Unset */
968         c->x86_clflush_size = 64;
969         c->x86_cache_alignment = c->x86_clflush_size;
970         c->x86_num_cores = 1;
971         c->extended_cpuid_level = 0;
972         memset(&c->x86_capability, 0, sizeof c->x86_capability);
973
974         /* Get vendor name */
975         cpuid(0x00000000, (unsigned int *)&c->cpuid_level,
976               (unsigned int *)&c->x86_vendor_id[0],
977               (unsigned int *)&c->x86_vendor_id[8],
978               (unsigned int *)&c->x86_vendor_id[4]);
979                 
980         get_cpu_vendor(c);
981
982         /* Initialize the standard set of capabilities */
983         /* Note that the vendor-specific code below might override */
984
985         /* Intel-defined flags: level 0x00000001 */
986         if (c->cpuid_level >= 0x00000001) {
987                 __u32 misc;
988                 cpuid(0x00000001, &tfms, &misc, &c->x86_capability[4],
989                       &c->x86_capability[0]);
990                 c->x86 = (tfms >> 8) & 0xf;
991                 c->x86_model = (tfms >> 4) & 0xf;
992                 c->x86_mask = tfms & 0xf;
993                 if (c->x86 == 0xf) {
994                         c->x86 += (tfms >> 20) & 0xff;
995                         c->x86_model += ((tfms >> 16) & 0xF) << 4;
996                 } 
997                 if (c->x86_capability[0] & (1<<19)) 
998                         c->x86_clflush_size = ((misc >> 8) & 0xff) * 8;
999         } else {
1000                 /* Have CPUID level 0 only - unheard of */
1001                 c->x86 = 4;
1002         }
1003
1004 #ifdef CONFIG_SMP
1005         phys_proc_id[smp_processor_id()] = (cpuid_ebx(1) >> 24) & 0xff;
1006 #endif
1007 }
1008
1009 /*
1010  * This does the hard work of actually picking apart the CPU stuff...
1011  */
1012 void __cpuinit identify_cpu(struct cpuinfo_x86 *c)
1013 {
1014         int i;
1015         u32 xlvl;
1016
1017         early_identify_cpu(c);
1018
1019         /* AMD-defined flags: level 0x80000001 */
1020         xlvl = cpuid_eax(0x80000000);
1021         c->extended_cpuid_level = xlvl;
1022         if ((xlvl & 0xffff0000) == 0x80000000) {
1023                 if (xlvl >= 0x80000001) {
1024                         c->x86_capability[1] = cpuid_edx(0x80000001);
1025                         c->x86_capability[6] = cpuid_ecx(0x80000001);
1026                 }
1027                 if (xlvl >= 0x80000004)
1028                         get_model_name(c); /* Default name */
1029         }
1030
1031         /* Transmeta-defined flags: level 0x80860001 */
1032         xlvl = cpuid_eax(0x80860000);
1033         if ((xlvl & 0xffff0000) == 0x80860000) {
1034                 /* Don't set x86_cpuid_level here for now to not confuse. */
1035                 if (xlvl >= 0x80860001)
1036                         c->x86_capability[2] = cpuid_edx(0x80860001);
1037         }
1038
1039         /*
1040          * Vendor-specific initialization.  In this section we
1041          * canonicalize the feature flags, meaning if there are
1042          * features a certain CPU supports which CPUID doesn't
1043          * tell us, CPUID claiming incorrect flags, or other bugs,
1044          * we handle them here.
1045          *
1046          * At the end of this section, c->x86_capability better
1047          * indicate the features this CPU genuinely supports!
1048          */
1049         switch (c->x86_vendor) {
1050         case X86_VENDOR_AMD:
1051                 init_amd(c);
1052                 break;
1053
1054         case X86_VENDOR_INTEL:
1055                 init_intel(c);
1056                 break;
1057
1058         case X86_VENDOR_UNKNOWN:
1059         default:
1060                 display_cacheinfo(c);
1061                 break;
1062         }
1063
1064         select_idle_routine(c);
1065         detect_ht(c); 
1066
1067         /*
1068          * On SMP, boot_cpu_data holds the common feature set between
1069          * all CPUs; so make sure that we indicate which features are
1070          * common between the CPUs.  The first time this routine gets
1071          * executed, c == &boot_cpu_data.
1072          */
1073         if (c != &boot_cpu_data) {
1074                 /* AND the already accumulated flags with these */
1075                 for (i = 0 ; i < NCAPINTS ; i++)
1076                         boot_cpu_data.x86_capability[i] &= c->x86_capability[i];
1077         }
1078
1079 #ifdef CONFIG_X86_MCE
1080         mcheck_init(c);
1081 #endif
1082         if (c == &boot_cpu_data)
1083                 mtrr_bp_init();
1084         else
1085                 mtrr_ap_init();
1086 #ifdef CONFIG_NUMA
1087         numa_add_cpu(smp_processor_id());
1088 #endif
1089 }
1090  
1091
1092 void __cpuinit print_cpu_info(struct cpuinfo_x86 *c)
1093 {
1094         if (c->x86_model_id[0])
1095                 printk("%s", c->x86_model_id);
1096
1097         if (c->x86_mask || c->cpuid_level >= 0) 
1098                 printk(" stepping %02x\n", c->x86_mask);
1099         else
1100                 printk("\n");
1101 }
1102
1103 /*
1104  *      Get CPU information for use by the procfs.
1105  */
1106
1107 static int show_cpuinfo(struct seq_file *m, void *v)
1108 {
1109         struct cpuinfo_x86 *c = v;
1110
1111         /* 
1112          * These flag bits must match the definitions in <asm/cpufeature.h>.
1113          * NULL means this bit is undefined or reserved; either way it doesn't
1114          * have meaning as far as Linux is concerned.  Note that it's important
1115          * to realize there is a difference between this table and CPUID -- if
1116          * applications want to get the raw CPUID data, they should access
1117          * /dev/cpu/<cpu_nr>/cpuid instead.
1118          */
1119         static char *x86_cap_flags[] = {
1120                 /* Intel-defined */
1121                 "fpu", "vme", "de", "pse", "tsc", "msr", "pae", "mce",
1122                 "cx8", "apic", NULL, "sep", "mtrr", "pge", "mca", "cmov",
1123                 "pat", "pse36", "pn", "clflush", NULL, "dts", "acpi", "mmx",
1124                 "fxsr", "sse", "sse2", "ss", "ht", "tm", "ia64", NULL,
1125
1126                 /* AMD-defined */
1127                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1128                 NULL, NULL, NULL, "syscall", NULL, NULL, NULL, NULL,
1129                 NULL, NULL, NULL, NULL, "nx", NULL, "mmxext", NULL,
1130                 NULL, "fxsr_opt", NULL, NULL, NULL, "lm", "3dnowext", "3dnow",
1131
1132                 /* Transmeta-defined */
1133                 "recovery", "longrun", NULL, "lrti", NULL, NULL, NULL, NULL,
1134                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1135                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1136                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1137
1138                 /* Other (Linux-defined) */
1139                 "cxmmx", NULL, "cyrix_arr", "centaur_mcr", NULL,
1140                 "constant_tsc", NULL, NULL,
1141                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1142                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1143                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1144
1145                 /* Intel-defined (#2) */
1146                 "pni", NULL, NULL, "monitor", "ds_cpl", NULL, NULL, "est",
1147                 "tm2", NULL, "cid", NULL, NULL, "cx16", "xtpr", NULL,
1148                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1149                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1150
1151                 /* VIA/Cyrix/Centaur-defined */
1152                 NULL, NULL, "rng", "rng_en", NULL, NULL, "ace", "ace_en",
1153                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1154                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1155                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1156
1157                 /* AMD-defined (#2) */
1158                 "lahf_lm", "cmp_legacy", NULL, NULL, NULL, NULL, NULL, NULL,
1159                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1160                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1161                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1162         };
1163         static char *x86_power_flags[] = { 
1164                 "ts",   /* temperature sensor */
1165                 "fid",  /* frequency id control */
1166                 "vid",  /* voltage id control */
1167                 "ttp",  /* thermal trip */
1168                 "tm",
1169                 "stc"
1170         };
1171
1172
1173 #ifdef CONFIG_SMP
1174         if (!cpu_online(c-cpu_data))
1175                 return 0;
1176 #endif
1177
1178         seq_printf(m,"processor\t: %u\n"
1179                      "vendor_id\t: %s\n"
1180                      "cpu family\t: %d\n"
1181                      "model\t\t: %d\n"
1182                      "model name\t: %s\n",
1183                      (unsigned)(c-cpu_data),
1184                      c->x86_vendor_id[0] ? c->x86_vendor_id : "unknown",
1185                      c->x86,
1186                      (int)c->x86_model,
1187                      c->x86_model_id[0] ? c->x86_model_id : "unknown");
1188         
1189         if (c->x86_mask || c->cpuid_level >= 0)
1190                 seq_printf(m, "stepping\t: %d\n", c->x86_mask);
1191         else
1192                 seq_printf(m, "stepping\t: unknown\n");
1193         
1194         if (cpu_has(c,X86_FEATURE_TSC)) {
1195                 seq_printf(m, "cpu MHz\t\t: %u.%03u\n",
1196                              cpu_khz / 1000, (cpu_khz % 1000));
1197         }
1198
1199         /* Cache size */
1200         if (c->x86_cache_size >= 0) 
1201                 seq_printf(m, "cache size\t: %d KB\n", c->x86_cache_size);
1202         
1203 #ifdef CONFIG_SMP
1204         if (smp_num_siblings * c->x86_num_cores > 1) {
1205                 int cpu = c - cpu_data;
1206                 seq_printf(m, "physical id\t: %d\n", phys_proc_id[cpu]);
1207                 seq_printf(m, "siblings\t: %d\n",
1208                                 c->x86_num_cores * smp_num_siblings);
1209                 seq_printf(m, "core id\t\t: %d\n", cpu_core_id[cpu]);
1210                 seq_printf(m, "cpu cores\t: %d\n", c->x86_num_cores);
1211         }
1212 #endif  
1213
1214         seq_printf(m,
1215                 "fpu\t\t: yes\n"
1216                 "fpu_exception\t: yes\n"
1217                 "cpuid level\t: %d\n"
1218                 "wp\t\t: yes\n"
1219                 "flags\t\t:",
1220                    c->cpuid_level);
1221
1222         { 
1223                 int i; 
1224                 for ( i = 0 ; i < 32*NCAPINTS ; i++ )
1225                         if ( test_bit(i, &c->x86_capability) &&
1226                              x86_cap_flags[i] != NULL )
1227                                 seq_printf(m, " %s", x86_cap_flags[i]);
1228         }
1229                 
1230         seq_printf(m, "\nbogomips\t: %lu.%02lu\n",
1231                    c->loops_per_jiffy/(500000/HZ),
1232                    (c->loops_per_jiffy/(5000/HZ)) % 100);
1233
1234         if (c->x86_tlbsize > 0) 
1235                 seq_printf(m, "TLB size\t: %d 4K pages\n", c->x86_tlbsize);
1236         seq_printf(m, "clflush size\t: %d\n", c->x86_clflush_size);
1237         seq_printf(m, "cache_alignment\t: %d\n", c->x86_cache_alignment);
1238
1239         seq_printf(m, "address sizes\t: %u bits physical, %u bits virtual\n", 
1240                    c->x86_phys_bits, c->x86_virt_bits);
1241
1242         seq_printf(m, "power management:");
1243         {
1244                 unsigned i;
1245                 for (i = 0; i < 32; i++) 
1246                         if (c->x86_power & (1 << i)) {
1247                                 if (i < ARRAY_SIZE(x86_power_flags))
1248                                         seq_printf(m, " %s", x86_power_flags[i]);
1249                                 else
1250                                         seq_printf(m, " [%d]", i);
1251                         }
1252         }
1253
1254         seq_printf(m, "\n\n");
1255
1256         return 0;
1257 }
1258
1259 static void *c_start(struct seq_file *m, loff_t *pos)
1260 {
1261         return *pos < NR_CPUS ? cpu_data + *pos : NULL;
1262 }
1263
1264 static void *c_next(struct seq_file *m, void *v, loff_t *pos)
1265 {
1266         ++*pos;
1267         return c_start(m, pos);
1268 }
1269
1270 static void c_stop(struct seq_file *m, void *v)
1271 {
1272 }
1273
1274 struct seq_operations cpuinfo_op = {
1275         .start =c_start,
1276         .next = c_next,
1277         .stop = c_stop,
1278         .show = show_cpuinfo,
1279 };