mm: filter based on a nodemask as well as a gfp_mask
[linux-2.6.git] / include / linux / mempolicy.h
1 #ifndef _LINUX_MEMPOLICY_H
2 #define _LINUX_MEMPOLICY_H 1
3
4 #include <linux/errno.h>
5
6 /*
7  * NUMA memory policies for Linux.
8  * Copyright 2003,2004 Andi Kleen SuSE Labs
9  */
10
11 /* Policies */
12 #define MPOL_DEFAULT    0
13 #define MPOL_PREFERRED  1
14 #define MPOL_BIND       2
15 #define MPOL_INTERLEAVE 3
16
17 #define MPOL_MAX MPOL_INTERLEAVE
18
19 /* Flags for get_mem_policy */
20 #define MPOL_F_NODE     (1<<0)  /* return next IL mode instead of node mask */
21 #define MPOL_F_ADDR     (1<<1)  /* look up vma using address */
22 #define MPOL_F_MEMS_ALLOWED (1<<2) /* return allowed memories */
23
24 /* Flags for mbind */
25 #define MPOL_MF_STRICT  (1<<0)  /* Verify existing pages in the mapping */
26 #define MPOL_MF_MOVE    (1<<1)  /* Move pages owned by this process to conform to mapping */
27 #define MPOL_MF_MOVE_ALL (1<<2) /* Move every page to conform to mapping */
28 #define MPOL_MF_INTERNAL (1<<3) /* Internal flags start here */
29
30 #ifdef __KERNEL__
31
32 #include <linux/mmzone.h>
33 #include <linux/slab.h>
34 #include <linux/rbtree.h>
35 #include <linux/spinlock.h>
36 #include <linux/nodemask.h>
37
38 struct vm_area_struct;
39 struct mm_struct;
40
41 #ifdef CONFIG_NUMA
42
43 /*
44  * Describe a memory policy.
45  *
46  * A mempolicy can be either associated with a process or with a VMA.
47  * For VMA related allocations the VMA policy is preferred, otherwise
48  * the process policy is used. Interrupts ignore the memory policy
49  * of the current process.
50  *
51  * Locking policy for interlave:
52  * In process context there is no locking because only the process accesses
53  * its own state. All vma manipulation is somewhat protected by a down_read on
54  * mmap_sem.
55  *
56  * Freeing policy:
57  * Mempolicy objects are reference counted.  A mempolicy will be freed when
58  * mpol_free() decrements the reference count to zero.
59  *
60  * Copying policy objects:
61  * mpol_copy() allocates a new mempolicy and copies the specified mempolicy
62  * to the new storage.  The reference count of the new object is initialized
63  * to 1, representing the caller of mpol_copy().
64  */
65 struct mempolicy {
66         atomic_t refcnt;
67         short policy;   /* See MPOL_* above */
68         union {
69                 short            preferred_node; /* preferred */
70                 nodemask_t       nodes;         /* interleave/bind */
71                 /* undefined for default */
72         } v;
73         nodemask_t cpuset_mems_allowed; /* mempolicy relative to these nodes */
74 };
75
76 /*
77  * Support for managing mempolicy data objects (clone, copy, destroy)
78  * The default fast path of a NULL MPOL_DEFAULT policy is always inlined.
79  */
80
81 extern void __mpol_free(struct mempolicy *pol);
82 static inline void mpol_free(struct mempolicy *pol)
83 {
84         if (pol)
85                 __mpol_free(pol);
86 }
87
88 extern struct mempolicy *__mpol_copy(struct mempolicy *pol);
89 static inline struct mempolicy *mpol_copy(struct mempolicy *pol)
90 {
91         if (pol)
92                 pol = __mpol_copy(pol);
93         return pol;
94 }
95
96 #define vma_policy(vma) ((vma)->vm_policy)
97 #define vma_set_policy(vma, pol) ((vma)->vm_policy = (pol))
98
99 static inline void mpol_get(struct mempolicy *pol)
100 {
101         if (pol)
102                 atomic_inc(&pol->refcnt);
103 }
104
105 extern int __mpol_equal(struct mempolicy *a, struct mempolicy *b);
106 static inline int mpol_equal(struct mempolicy *a, struct mempolicy *b)
107 {
108         if (a == b)
109                 return 1;
110         return __mpol_equal(a, b);
111 }
112 #define vma_mpol_equal(a,b) mpol_equal(vma_policy(a), vma_policy(b))
113
114 /* Could later add inheritance of the process policy here. */
115
116 #define mpol_set_vma_default(vma) ((vma)->vm_policy = NULL)
117
118 /*
119  * Tree of shared policies for a shared memory region.
120  * Maintain the policies in a pseudo mm that contains vmas. The vmas
121  * carry the policy. As a special twist the pseudo mm is indexed in pages, not
122  * bytes, so that we can work with shared memory segments bigger than
123  * unsigned long.
124  */
125
126 struct sp_node {
127         struct rb_node nd;
128         unsigned long start, end;
129         struct mempolicy *policy;
130 };
131
132 struct shared_policy {
133         struct rb_root root;
134         spinlock_t lock;
135 };
136
137 void mpol_shared_policy_init(struct shared_policy *info, int policy,
138                                 nodemask_t *nodes);
139 int mpol_set_shared_policy(struct shared_policy *info,
140                                 struct vm_area_struct *vma,
141                                 struct mempolicy *new);
142 void mpol_free_shared_policy(struct shared_policy *p);
143 struct mempolicy *mpol_shared_policy_lookup(struct shared_policy *sp,
144                                             unsigned long idx);
145
146 extern void numa_default_policy(void);
147 extern void numa_policy_init(void);
148 extern void mpol_rebind_task(struct task_struct *tsk,
149                                         const nodemask_t *new);
150 extern void mpol_rebind_mm(struct mm_struct *mm, nodemask_t *new);
151 extern void mpol_fix_fork_child_flag(struct task_struct *p);
152
153 extern struct mempolicy default_policy;
154 extern struct zonelist *huge_zonelist(struct vm_area_struct *vma,
155                                 unsigned long addr, gfp_t gfp_flags,
156                                 struct mempolicy **mpol, nodemask_t **nodemask);
157 extern unsigned slab_node(struct mempolicy *policy);
158
159 extern enum zone_type policy_zone;
160
161 static inline void check_highest_zone(enum zone_type k)
162 {
163         if (k > policy_zone && k != ZONE_MOVABLE)
164                 policy_zone = k;
165 }
166
167 int do_migrate_pages(struct mm_struct *mm,
168         const nodemask_t *from_nodes, const nodemask_t *to_nodes, int flags);
169
170 #else
171
172 struct mempolicy {};
173
174 static inline int mpol_equal(struct mempolicy *a, struct mempolicy *b)
175 {
176         return 1;
177 }
178 #define vma_mpol_equal(a,b) 1
179
180 #define mpol_set_vma_default(vma) do {} while(0)
181
182 static inline void mpol_free(struct mempolicy *p)
183 {
184 }
185
186 static inline void mpol_get(struct mempolicy *pol)
187 {
188 }
189
190 static inline struct mempolicy *mpol_copy(struct mempolicy *old)
191 {
192         return NULL;
193 }
194
195 struct shared_policy {};
196
197 static inline int mpol_set_shared_policy(struct shared_policy *info,
198                                         struct vm_area_struct *vma,
199                                         struct mempolicy *new)
200 {
201         return -EINVAL;
202 }
203
204 static inline void mpol_shared_policy_init(struct shared_policy *info,
205                                         int policy, nodemask_t *nodes)
206 {
207 }
208
209 static inline void mpol_free_shared_policy(struct shared_policy *p)
210 {
211 }
212
213 static inline struct mempolicy *
214 mpol_shared_policy_lookup(struct shared_policy *sp, unsigned long idx)
215 {
216         return NULL;
217 }
218
219 #define vma_policy(vma) NULL
220 #define vma_set_policy(vma, pol) do {} while(0)
221
222 static inline void numa_policy_init(void)
223 {
224 }
225
226 static inline void numa_default_policy(void)
227 {
228 }
229
230 static inline void mpol_rebind_task(struct task_struct *tsk,
231                                         const nodemask_t *new)
232 {
233 }
234
235 static inline void mpol_rebind_mm(struct mm_struct *mm, nodemask_t *new)
236 {
237 }
238
239 static inline void mpol_fix_fork_child_flag(struct task_struct *p)
240 {
241 }
242
243 static inline struct zonelist *huge_zonelist(struct vm_area_struct *vma,
244                                 unsigned long addr, gfp_t gfp_flags,
245                                 struct mempolicy **mpol, nodemask_t **nodemask)
246 {
247         *mpol = NULL;
248         *nodemask = NULL;
249         return node_zonelist(0, gfp_flags);
250 }
251
252 static inline int do_migrate_pages(struct mm_struct *mm,
253                         const nodemask_t *from_nodes,
254                         const nodemask_t *to_nodes, int flags)
255 {
256         return 0;
257 }
258
259 static inline void check_highest_zone(int k)
260 {
261 }
262 #endif /* CONFIG_NUMA */
263 #endif /* __KERNEL__ */
264
265 #endif