[PATCH] Add __GFP_THISNODE to avoid fallback to other nodes and ignore cpuset/memory...
[linux-2.6.git] / include / linux / gfp.h
1 #ifndef __LINUX_GFP_H
2 #define __LINUX_GFP_H
3
4 #include <linux/mmzone.h>
5 #include <linux/stddef.h>
6 #include <linux/linkage.h>
7
8 struct vm_area_struct;
9
10 /*
11  * GFP bitmasks..
12  *
13  * Zone modifiers (see linux/mmzone.h - low three bits)
14  *
15  * Do not put any conditional on these. If necessary modify the definitions
16  * without the underscores and use the consistently. The definitions here may
17  * be used in bit comparisons.
18  */
19 #define __GFP_DMA       ((__force gfp_t)0x01u)
20 #define __GFP_HIGHMEM   ((__force gfp_t)0x02u)
21 #define __GFP_DMA32     ((__force gfp_t)0x04u)
22
23 /*
24  * Action modifiers - doesn't change the zoning
25  *
26  * __GFP_REPEAT: Try hard to allocate the memory, but the allocation attempt
27  * _might_ fail.  This depends upon the particular VM implementation.
28  *
29  * __GFP_NOFAIL: The VM implementation _must_ retry infinitely: the caller
30  * cannot handle allocation failures.
31  *
32  * __GFP_NORETRY: The VM implementation must not retry indefinitely.
33  */
34 #define __GFP_WAIT      ((__force gfp_t)0x10u)  /* Can wait and reschedule? */
35 #define __GFP_HIGH      ((__force gfp_t)0x20u)  /* Should access emergency pools? */
36 #define __GFP_IO        ((__force gfp_t)0x40u)  /* Can start physical IO? */
37 #define __GFP_FS        ((__force gfp_t)0x80u)  /* Can call down to low-level FS? */
38 #define __GFP_COLD      ((__force gfp_t)0x100u) /* Cache-cold page required */
39 #define __GFP_NOWARN    ((__force gfp_t)0x200u) /* Suppress page allocation failure warning */
40 #define __GFP_REPEAT    ((__force gfp_t)0x400u) /* Retry the allocation.  Might fail */
41 #define __GFP_NOFAIL    ((__force gfp_t)0x800u) /* Retry for ever.  Cannot fail */
42 #define __GFP_NORETRY   ((__force gfp_t)0x1000u)/* Do not retry.  Might fail */
43 #define __GFP_NO_GROW   ((__force gfp_t)0x2000u)/* Slab internal usage */
44 #define __GFP_COMP      ((__force gfp_t)0x4000u)/* Add compound page metadata */
45 #define __GFP_ZERO      ((__force gfp_t)0x8000u)/* Return zeroed page on success */
46 #define __GFP_NOMEMALLOC ((__force gfp_t)0x10000u) /* Don't use emergency reserves */
47 #define __GFP_HARDWALL   ((__force gfp_t)0x20000u) /* Enforce hardwall cpuset memory allocs */
48 #define __GFP_THISNODE  ((__force gfp_t)0x40000u)/* No fallback, no policies */
49
50 #define __GFP_BITS_SHIFT 20     /* Room for 20 __GFP_FOO bits */
51 #define __GFP_BITS_MASK ((__force gfp_t)((1 << __GFP_BITS_SHIFT) - 1))
52
53 /* if you forget to add the bitmask here kernel will crash, period */
54 #define GFP_LEVEL_MASK (__GFP_WAIT|__GFP_HIGH|__GFP_IO|__GFP_FS| \
55                         __GFP_COLD|__GFP_NOWARN|__GFP_REPEAT| \
56                         __GFP_NOFAIL|__GFP_NORETRY|__GFP_NO_GROW|__GFP_COMP| \
57                         __GFP_NOMEMALLOC|__GFP_HARDWALL|__GFP_THISNODE)
58
59 /* This equals 0, but use constants in case they ever change */
60 #define GFP_NOWAIT      (GFP_ATOMIC & ~__GFP_HIGH)
61 /* GFP_ATOMIC means both !wait (__GFP_WAIT not set) and use emergency pool */
62 #define GFP_ATOMIC      (__GFP_HIGH)
63 #define GFP_NOIO        (__GFP_WAIT)
64 #define GFP_NOFS        (__GFP_WAIT | __GFP_IO)
65 #define GFP_KERNEL      (__GFP_WAIT | __GFP_IO | __GFP_FS)
66 #define GFP_USER        (__GFP_WAIT | __GFP_IO | __GFP_FS | __GFP_HARDWALL)
67 #define GFP_HIGHUSER    (__GFP_WAIT | __GFP_IO | __GFP_FS | __GFP_HARDWALL | \
68                          __GFP_HIGHMEM)
69
70 /* Flag - indicates that the buffer will be suitable for DMA.  Ignored on some
71    platforms, used as appropriate on others */
72
73 #define GFP_DMA         __GFP_DMA
74
75 /* 4GB DMA on some platforms */
76 #define GFP_DMA32       __GFP_DMA32
77
78
79 static inline enum zone_type gfp_zone(gfp_t flags)
80 {
81         if (flags & __GFP_DMA)
82                 return ZONE_DMA;
83 #ifdef CONFIG_ZONE_DMA32
84         if (flags & __GFP_DMA32)
85                 return ZONE_DMA32;
86 #endif
87 #ifdef CONFIG_HIGHMEM
88         if (flags & __GFP_HIGHMEM)
89                 return ZONE_HIGHMEM;
90 #endif
91         return ZONE_NORMAL;
92 }
93
94 /*
95  * There is only one page-allocator function, and two main namespaces to
96  * it. The alloc_page*() variants return 'struct page *' and as such
97  * can allocate highmem pages, the *get*page*() variants return
98  * virtual kernel addresses to the allocated page(s).
99  */
100
101 /*
102  * We get the zone list from the current node and the gfp_mask.
103  * This zone list contains a maximum of MAXNODES*MAX_NR_ZONES zones.
104  *
105  * For the normal case of non-DISCONTIGMEM systems the NODE_DATA() gets
106  * optimized to &contig_page_data at compile-time.
107  */
108
109 #ifndef HAVE_ARCH_FREE_PAGE
110 static inline void arch_free_page(struct page *page, int order) { }
111 #endif
112
113 extern struct page *
114 FASTCALL(__alloc_pages(gfp_t, unsigned int, struct zonelist *));
115
116 static inline struct page *alloc_pages_node(int nid, gfp_t gfp_mask,
117                                                 unsigned int order)
118 {
119         if (unlikely(order >= MAX_ORDER))
120                 return NULL;
121
122         /* Unknown node is current node */
123         if (nid < 0)
124                 nid = numa_node_id();
125
126         return __alloc_pages(gfp_mask, order,
127                 NODE_DATA(nid)->node_zonelists + gfp_zone(gfp_mask));
128 }
129
130 #ifdef CONFIG_NUMA
131 extern struct page *alloc_pages_current(gfp_t gfp_mask, unsigned order);
132
133 static inline struct page *
134 alloc_pages(gfp_t gfp_mask, unsigned int order)
135 {
136         if (unlikely(order >= MAX_ORDER))
137                 return NULL;
138
139         return alloc_pages_current(gfp_mask, order);
140 }
141 extern struct page *alloc_page_vma(gfp_t gfp_mask,
142                         struct vm_area_struct *vma, unsigned long addr);
143 #else
144 #define alloc_pages(gfp_mask, order) \
145                 alloc_pages_node(numa_node_id(), gfp_mask, order)
146 #define alloc_page_vma(gfp_mask, vma, addr) alloc_pages(gfp_mask, 0)
147 #endif
148 #define alloc_page(gfp_mask) alloc_pages(gfp_mask, 0)
149
150 extern unsigned long FASTCALL(__get_free_pages(gfp_t gfp_mask, unsigned int order));
151 extern unsigned long FASTCALL(get_zeroed_page(gfp_t gfp_mask));
152
153 #define __get_free_page(gfp_mask) \
154                 __get_free_pages((gfp_mask),0)
155
156 #define __get_dma_pages(gfp_mask, order) \
157                 __get_free_pages((gfp_mask) | GFP_DMA,(order))
158
159 extern void FASTCALL(__free_pages(struct page *page, unsigned int order));
160 extern void FASTCALL(free_pages(unsigned long addr, unsigned int order));
161 extern void FASTCALL(free_hot_page(struct page *page));
162 extern void FASTCALL(free_cold_page(struct page *page));
163
164 #define __free_page(page) __free_pages((page), 0)
165 #define free_page(addr) free_pages((addr),0)
166
167 void page_alloc_init(void);
168 #ifdef CONFIG_NUMA
169 void drain_node_pages(int node);
170 #else
171 static inline void drain_node_pages(int node) { };
172 #endif
173
174 #endif /* __LINUX_GFP_H */