x86: fix leak un ioremap_page_range() failure
[linux-3.10.git] / arch / x86 / mm / ioremap.c
1 /*
2  * Re-map IO memory to kernel address space so that we can access it.
3  * This is needed for high PCI addresses that aren't mapped in the
4  * 640k-1MB IO memory area on PC's
5  *
6  * (C) Copyright 1995 1996 Linus Torvalds
7  */
8
9 #include <linux/bootmem.h>
10 #include <linux/init.h>
11 #include <linux/io.h>
12 #include <linux/module.h>
13 #include <linux/slab.h>
14 #include <linux/vmalloc.h>
15
16 #include <asm/cacheflush.h>
17 #include <asm/e820.h>
18 #include <asm/fixmap.h>
19 #include <asm/pgtable.h>
20 #include <asm/tlbflush.h>
21 #include <asm/pgalloc.h>
22
23 enum ioremap_mode {
24         IOR_MODE_UNCACHED,
25         IOR_MODE_CACHED,
26 };
27
28 #ifdef CONFIG_X86_64
29
30 unsigned long __phys_addr(unsigned long x)
31 {
32         if (x >= __START_KERNEL_map)
33                 return x - __START_KERNEL_map + phys_base;
34         return x - PAGE_OFFSET;
35 }
36 EXPORT_SYMBOL(__phys_addr);
37
38 #endif
39
40 int page_is_ram(unsigned long pagenr)
41 {
42         unsigned long addr, end;
43         int i;
44
45         /*
46          * A special case is the first 4Kb of memory;
47          * This is a BIOS owned area, not kernel ram, but generally
48          * not listed as such in the E820 table.
49          */
50         if (pagenr == 0)
51                 return 0;
52
53         /*
54          * Second special case: Some BIOSen report the PC BIOS
55          * area (640->1Mb) as ram even though it is not.
56          */
57         if (pagenr >= (BIOS_BEGIN >> PAGE_SHIFT) &&
58                     pagenr < (BIOS_END >> PAGE_SHIFT))
59                 return 0;
60
61         for (i = 0; i < e820.nr_map; i++) {
62                 /*
63                  * Not usable memory:
64                  */
65                 if (e820.map[i].type != E820_RAM)
66                         continue;
67                 addr = (e820.map[i].addr + PAGE_SIZE-1) >> PAGE_SHIFT;
68                 end = (e820.map[i].addr + e820.map[i].size) >> PAGE_SHIFT;
69
70
71                 if ((pagenr >= addr) && (pagenr < end))
72                         return 1;
73         }
74         return 0;
75 }
76
77 /*
78  * Fix up the linear direct mapping of the kernel to avoid cache attribute
79  * conflicts.
80  */
81 static int ioremap_change_attr(unsigned long vaddr, unsigned long size,
82                                enum ioremap_mode mode)
83 {
84         unsigned long nrpages = size >> PAGE_SHIFT;
85         int err;
86
87         switch (mode) {
88         case IOR_MODE_UNCACHED:
89         default:
90                 err = set_memory_uc(vaddr, nrpages);
91                 break;
92         case IOR_MODE_CACHED:
93                 err = set_memory_wb(vaddr, nrpages);
94                 break;
95         }
96
97         return err;
98 }
99
100 /*
101  * Remap an arbitrary physical address space into the kernel virtual
102  * address space. Needed when the kernel wants to access high addresses
103  * directly.
104  *
105  * NOTE! We need to allow non-page-aligned mappings too: we will obviously
106  * have to convert them into an offset in a page-aligned mapping, but the
107  * caller shouldn't need to know that small detail.
108  */
109 static void __iomem *__ioremap(unsigned long phys_addr, unsigned long size,
110                                enum ioremap_mode mode)
111 {
112         unsigned long pfn, offset, last_addr, vaddr;
113         struct vm_struct *area;
114         pgprot_t prot;
115
116         /* Don't allow wraparound or zero size */
117         last_addr = phys_addr + size - 1;
118         if (!size || last_addr < phys_addr)
119                 return NULL;
120
121         /*
122          * Don't remap the low PCI/ISA area, it's always mapped..
123          */
124         if (phys_addr >= ISA_START_ADDRESS && last_addr < ISA_END_ADDRESS)
125                 return (__force void __iomem *)phys_to_virt(phys_addr);
126
127         /*
128          * Don't allow anybody to remap normal RAM that we're using..
129          */
130         for (pfn = phys_addr >> PAGE_SHIFT; pfn < max_pfn_mapped &&
131              (pfn << PAGE_SHIFT) < last_addr; pfn++) {
132                 if (page_is_ram(pfn) && pfn_valid(pfn) &&
133                     !PageReserved(pfn_to_page(pfn)))
134                         return NULL;
135         }
136
137         WARN_ON_ONCE(page_is_ram(pfn));
138
139         switch (mode) {
140         case IOR_MODE_UNCACHED:
141         default:
142                 prot = PAGE_KERNEL_NOCACHE;
143                 break;
144         case IOR_MODE_CACHED:
145                 prot = PAGE_KERNEL;
146                 break;
147         }
148
149         /*
150          * Mappings have to be page-aligned
151          */
152         offset = phys_addr & ~PAGE_MASK;
153         phys_addr &= PAGE_MASK;
154         size = PAGE_ALIGN(last_addr+1) - phys_addr;
155
156         /*
157          * Ok, go for it..
158          */
159         area = get_vm_area(size, VM_IOREMAP);
160         if (!area)
161                 return NULL;
162         area->phys_addr = phys_addr;
163         vaddr = (unsigned long) area->addr;
164         if (ioremap_page_range(vaddr, vaddr + size, phys_addr, prot)) {
165                 free_vm_area(area);
166                 return NULL;
167         }
168
169         if (ioremap_change_attr(vaddr, size, mode) < 0) {
170                 vunmap(area->addr);
171                 return NULL;
172         }
173
174         return (void __iomem *) (vaddr + offset);
175 }
176
177 /**
178  * ioremap_nocache     -   map bus memory into CPU space
179  * @offset:    bus address of the memory
180  * @size:      size of the resource to map
181  *
182  * ioremap_nocache performs a platform specific sequence of operations to
183  * make bus memory CPU accessible via the readb/readw/readl/writeb/
184  * writew/writel functions and the other mmio helpers. The returned
185  * address is not guaranteed to be usable directly as a virtual
186  * address.
187  *
188  * This version of ioremap ensures that the memory is marked uncachable
189  * on the CPU as well as honouring existing caching rules from things like
190  * the PCI bus. Note that there are other caches and buffers on many
191  * busses. In particular driver authors should read up on PCI writes
192  *
193  * It's useful if some control registers are in such an area and
194  * write combining or read caching is not desirable:
195  *
196  * Must be freed with iounmap.
197  */
198 void __iomem *ioremap_nocache(unsigned long phys_addr, unsigned long size)
199 {
200         return __ioremap(phys_addr, size, IOR_MODE_UNCACHED);
201 }
202 EXPORT_SYMBOL(ioremap_nocache);
203
204 void __iomem *ioremap_cache(unsigned long phys_addr, unsigned long size)
205 {
206         return __ioremap(phys_addr, size, IOR_MODE_CACHED);
207 }
208 EXPORT_SYMBOL(ioremap_cache);
209
210 /**
211  * iounmap - Free a IO remapping
212  * @addr: virtual address from ioremap_*
213  *
214  * Caller must ensure there is only one unmapping for the same pointer.
215  */
216 void iounmap(volatile void __iomem *addr)
217 {
218         struct vm_struct *p, *o;
219
220         if ((void __force *)addr <= high_memory)
221                 return;
222
223         /*
224          * __ioremap special-cases the PCI/ISA range by not instantiating a
225          * vm_area and by simply returning an address into the kernel mapping
226          * of ISA space.   So handle that here.
227          */
228         if (addr >= phys_to_virt(ISA_START_ADDRESS) &&
229             addr < phys_to_virt(ISA_END_ADDRESS))
230                 return;
231
232         addr = (volatile void __iomem *)
233                 (PAGE_MASK & (unsigned long __force)addr);
234
235         /* Use the vm area unlocked, assuming the caller
236            ensures there isn't another iounmap for the same address
237            in parallel. Reuse of the virtual address is prevented by
238            leaving it in the global lists until we're done with it.
239            cpa takes care of the direct mappings. */
240         read_lock(&vmlist_lock);
241         for (p = vmlist; p; p = p->next) {
242                 if (p->addr == addr)
243                         break;
244         }
245         read_unlock(&vmlist_lock);
246
247         if (!p) {
248                 printk(KERN_ERR "iounmap: bad address %p\n", addr);
249                 dump_stack();
250                 return;
251         }
252
253         /* Finally remove it */
254         o = remove_vm_area((void *)addr);
255         BUG_ON(p != o || o == NULL);
256         kfree(p);
257 }
258 EXPORT_SYMBOL(iounmap);
259
260 #ifdef CONFIG_X86_32
261
262 int __initdata early_ioremap_debug;
263
264 static int __init early_ioremap_debug_setup(char *str)
265 {
266         early_ioremap_debug = 1;
267
268         return 0;
269 }
270 early_param("early_ioremap_debug", early_ioremap_debug_setup);
271
272 static __initdata int after_paging_init;
273 static __initdata pte_t bm_pte[PAGE_SIZE/sizeof(pte_t)]
274                                 __attribute__((aligned(PAGE_SIZE)));
275
276 static inline pmd_t * __init early_ioremap_pmd(unsigned long addr)
277 {
278         /* Don't assume we're using swapper_pg_dir at this point */
279         pgd_t *base = __va(read_cr3());
280         pgd_t *pgd = &base[pgd_index(addr)];
281         pud_t *pud = pud_offset(pgd, addr);
282         pmd_t *pmd = pmd_offset(pud, addr);
283
284         return pmd;
285 }
286
287 static inline pte_t * __init early_ioremap_pte(unsigned long addr)
288 {
289         return &bm_pte[pte_index(addr)];
290 }
291
292 void __init early_ioremap_init(void)
293 {
294         pmd_t *pmd;
295
296         if (early_ioremap_debug)
297                 printk(KERN_INFO "early_ioremap_init()\n");
298
299         pmd = early_ioremap_pmd(fix_to_virt(FIX_BTMAP_BEGIN));
300         memset(bm_pte, 0, sizeof(bm_pte));
301         pmd_populate_kernel(&init_mm, pmd, bm_pte);
302
303         /*
304          * The boot-ioremap range spans multiple pmds, for which
305          * we are not prepared:
306          */
307         if (pmd != early_ioremap_pmd(fix_to_virt(FIX_BTMAP_END))) {
308                 WARN_ON(1);
309                 printk(KERN_WARNING "pmd %p != %p\n",
310                        pmd, early_ioremap_pmd(fix_to_virt(FIX_BTMAP_END)));
311                 printk(KERN_WARNING "fix_to_virt(FIX_BTMAP_BEGIN): %08lx\n",
312                         fix_to_virt(FIX_BTMAP_BEGIN));
313                 printk(KERN_WARNING "fix_to_virt(FIX_BTMAP_END):   %08lx\n",
314                         fix_to_virt(FIX_BTMAP_END));
315
316                 printk(KERN_WARNING "FIX_BTMAP_END:       %d\n", FIX_BTMAP_END);
317                 printk(KERN_WARNING "FIX_BTMAP_BEGIN:     %d\n",
318                        FIX_BTMAP_BEGIN);
319         }
320 }
321
322 void __init early_ioremap_clear(void)
323 {
324         pmd_t *pmd;
325
326         if (early_ioremap_debug)
327                 printk(KERN_INFO "early_ioremap_clear()\n");
328
329         pmd = early_ioremap_pmd(fix_to_virt(FIX_BTMAP_BEGIN));
330         pmd_clear(pmd);
331         paravirt_release_pt(__pa(bm_pte) >> PAGE_SHIFT);
332         __flush_tlb_all();
333 }
334
335 void __init early_ioremap_reset(void)
336 {
337         enum fixed_addresses idx;
338         unsigned long addr, phys;
339         pte_t *pte;
340
341         after_paging_init = 1;
342         for (idx = FIX_BTMAP_BEGIN; idx >= FIX_BTMAP_END; idx--) {
343                 addr = fix_to_virt(idx);
344                 pte = early_ioremap_pte(addr);
345                 if (pte_present(*pte)) {
346                         phys = pte_val(*pte) & PAGE_MASK;
347                         set_fixmap(idx, phys);
348                 }
349         }
350 }
351
352 static void __init __early_set_fixmap(enum fixed_addresses idx,
353                                    unsigned long phys, pgprot_t flags)
354 {
355         unsigned long addr = __fix_to_virt(idx);
356         pte_t *pte;
357
358         if (idx >= __end_of_fixed_addresses) {
359                 BUG();
360                 return;
361         }
362         pte = early_ioremap_pte(addr);
363         if (pgprot_val(flags))
364                 set_pte(pte, pfn_pte(phys >> PAGE_SHIFT, flags));
365         else
366                 pte_clear(NULL, addr, pte);
367         __flush_tlb_one(addr);
368 }
369
370 static inline void __init early_set_fixmap(enum fixed_addresses idx,
371                                         unsigned long phys)
372 {
373         if (after_paging_init)
374                 set_fixmap(idx, phys);
375         else
376                 __early_set_fixmap(idx, phys, PAGE_KERNEL);
377 }
378
379 static inline void __init early_clear_fixmap(enum fixed_addresses idx)
380 {
381         if (after_paging_init)
382                 clear_fixmap(idx);
383         else
384                 __early_set_fixmap(idx, 0, __pgprot(0));
385 }
386
387
388 int __initdata early_ioremap_nested;
389
390 static int __init check_early_ioremap_leak(void)
391 {
392         if (!early_ioremap_nested)
393                 return 0;
394
395         printk(KERN_WARNING
396                "Debug warning: early ioremap leak of %d areas detected.\n",
397                early_ioremap_nested);
398         printk(KERN_WARNING
399                "please boot with early_ioremap_debug and report the dmesg.\n");
400         WARN_ON(1);
401
402         return 1;
403 }
404 late_initcall(check_early_ioremap_leak);
405
406 void __init *early_ioremap(unsigned long phys_addr, unsigned long size)
407 {
408         unsigned long offset, last_addr;
409         unsigned int nrpages, nesting;
410         enum fixed_addresses idx0, idx;
411
412         WARN_ON(system_state != SYSTEM_BOOTING);
413
414         nesting = early_ioremap_nested;
415         if (early_ioremap_debug) {
416                 printk(KERN_INFO "early_ioremap(%08lx, %08lx) [%d] => ",
417                        phys_addr, size, nesting);
418                 dump_stack();
419         }
420
421         /* Don't allow wraparound or zero size */
422         last_addr = phys_addr + size - 1;
423         if (!size || last_addr < phys_addr) {
424                 WARN_ON(1);
425                 return NULL;
426         }
427
428         if (nesting >= FIX_BTMAPS_NESTING) {
429                 WARN_ON(1);
430                 return NULL;
431         }
432         early_ioremap_nested++;
433         /*
434          * Mappings have to be page-aligned
435          */
436         offset = phys_addr & ~PAGE_MASK;
437         phys_addr &= PAGE_MASK;
438         size = PAGE_ALIGN(last_addr) - phys_addr;
439
440         /*
441          * Mappings have to fit in the FIX_BTMAP area.
442          */
443         nrpages = size >> PAGE_SHIFT;
444         if (nrpages > NR_FIX_BTMAPS) {
445                 WARN_ON(1);
446                 return NULL;
447         }
448
449         /*
450          * Ok, go for it..
451          */
452         idx0 = FIX_BTMAP_BEGIN - NR_FIX_BTMAPS*nesting;
453         idx = idx0;
454         while (nrpages > 0) {
455                 early_set_fixmap(idx, phys_addr);
456                 phys_addr += PAGE_SIZE;
457                 --idx;
458                 --nrpages;
459         }
460         if (early_ioremap_debug)
461                 printk(KERN_CONT "%08lx + %08lx\n", offset, fix_to_virt(idx0));
462
463         return (void *) (offset + fix_to_virt(idx0));
464 }
465
466 void __init early_iounmap(void *addr, unsigned long size)
467 {
468         unsigned long virt_addr;
469         unsigned long offset;
470         unsigned int nrpages;
471         enum fixed_addresses idx;
472         unsigned int nesting;
473
474         nesting = --early_ioremap_nested;
475         WARN_ON(nesting < 0);
476
477         if (early_ioremap_debug) {
478                 printk(KERN_INFO "early_iounmap(%p, %08lx) [%d]\n", addr,
479                        size, nesting);
480                 dump_stack();
481         }
482
483         virt_addr = (unsigned long)addr;
484         if (virt_addr < fix_to_virt(FIX_BTMAP_BEGIN)) {
485                 WARN_ON(1);
486                 return;
487         }
488         offset = virt_addr & ~PAGE_MASK;
489         nrpages = PAGE_ALIGN(offset + size - 1) >> PAGE_SHIFT;
490
491         idx = FIX_BTMAP_BEGIN - NR_FIX_BTMAPS*nesting;
492         while (nrpages > 0) {
493                 early_clear_fixmap(idx);
494                 --idx;
495                 --nrpages;
496         }
497 }
498
499 void __this_fixmap_does_not_exist(void)
500 {
501         WARN_ON(1);
502 }
503
504 #endif /* CONFIG_X86_32 */