mempolicy: add MPOL_F_RELATIVE_NODES flag
[linux-2.6.git] / include / linux / mempolicy.h
1 #ifndef _LINUX_MEMPOLICY_H
2 #define _LINUX_MEMPOLICY_H 1
3
4 #include <linux/errno.h>
5
6 /*
7  * NUMA memory policies for Linux.
8  * Copyright 2003,2004 Andi Kleen SuSE Labs
9  */
10
11 /*
12  * Both the MPOL_* mempolicy mode and the MPOL_F_* optional mode flags are
13  * passed by the user to either set_mempolicy() or mbind() in an 'int' actual.
14  * The MPOL_MODE_FLAGS macro determines the legal set of optional mode flags.
15  */
16
17 /* Policies */
18 enum {
19         MPOL_DEFAULT,
20         MPOL_PREFERRED,
21         MPOL_BIND,
22         MPOL_INTERLEAVE,
23         MPOL_MAX,       /* always last member of enum */
24 };
25
26 /* Flags for set_mempolicy */
27 #define MPOL_F_STATIC_NODES     (1 << 15)
28 #define MPOL_F_RELATIVE_NODES   (1 << 14)
29
30 /*
31  * MPOL_MODE_FLAGS is the union of all possible optional mode flags passed to
32  * either set_mempolicy() or mbind().
33  */
34 #define MPOL_MODE_FLAGS (MPOL_F_STATIC_NODES | MPOL_F_RELATIVE_NODES)
35
36 /* Flags for get_mempolicy */
37 #define MPOL_F_NODE     (1<<0)  /* return next IL mode instead of node mask */
38 #define MPOL_F_ADDR     (1<<1)  /* look up vma using address */
39 #define MPOL_F_MEMS_ALLOWED (1<<2) /* return allowed memories */
40
41 /* Flags for mbind */
42 #define MPOL_MF_STRICT  (1<<0)  /* Verify existing pages in the mapping */
43 #define MPOL_MF_MOVE    (1<<1)  /* Move pages owned by this process to conform to mapping */
44 #define MPOL_MF_MOVE_ALL (1<<2) /* Move every page to conform to mapping */
45 #define MPOL_MF_INTERNAL (1<<3) /* Internal flags start here */
46
47 #ifdef __KERNEL__
48
49 #include <linux/mmzone.h>
50 #include <linux/slab.h>
51 #include <linux/rbtree.h>
52 #include <linux/spinlock.h>
53 #include <linux/nodemask.h>
54
55 struct vm_area_struct;
56 struct mm_struct;
57
58 #ifdef CONFIG_NUMA
59
60 /*
61  * Describe a memory policy.
62  *
63  * A mempolicy can be either associated with a process or with a VMA.
64  * For VMA related allocations the VMA policy is preferred, otherwise
65  * the process policy is used. Interrupts ignore the memory policy
66  * of the current process.
67  *
68  * Locking policy for interlave:
69  * In process context there is no locking because only the process accesses
70  * its own state. All vma manipulation is somewhat protected by a down_read on
71  * mmap_sem.
72  *
73  * Freeing policy:
74  * Mempolicy objects are reference counted.  A mempolicy will be freed when
75  * mpol_free() decrements the reference count to zero.
76  *
77  * Copying policy objects:
78  * mpol_copy() allocates a new mempolicy and copies the specified mempolicy
79  * to the new storage.  The reference count of the new object is initialized
80  * to 1, representing the caller of mpol_copy().
81  */
82 struct mempolicy {
83         atomic_t refcnt;
84         unsigned short policy;  /* See MPOL_* above */
85         unsigned short flags;   /* See set_mempolicy() MPOL_F_* above */
86         union {
87                 short            preferred_node; /* preferred */
88                 nodemask_t       nodes;         /* interleave/bind */
89                 /* undefined for default */
90         } v;
91         union {
92                 nodemask_t cpuset_mems_allowed; /* relative to these nodes */
93                 nodemask_t user_nodemask;       /* nodemask passed by user */
94         } w;
95 };
96
97 /*
98  * Support for managing mempolicy data objects (clone, copy, destroy)
99  * The default fast path of a NULL MPOL_DEFAULT policy is always inlined.
100  */
101
102 extern void __mpol_free(struct mempolicy *pol);
103 static inline void mpol_free(struct mempolicy *pol)
104 {
105         if (pol)
106                 __mpol_free(pol);
107 }
108
109 extern struct mempolicy *__mpol_copy(struct mempolicy *pol);
110 static inline struct mempolicy *mpol_copy(struct mempolicy *pol)
111 {
112         if (pol)
113                 pol = __mpol_copy(pol);
114         return pol;
115 }
116
117 #define vma_policy(vma) ((vma)->vm_policy)
118 #define vma_set_policy(vma, pol) ((vma)->vm_policy = (pol))
119
120 static inline void mpol_get(struct mempolicy *pol)
121 {
122         if (pol)
123                 atomic_inc(&pol->refcnt);
124 }
125
126 extern int __mpol_equal(struct mempolicy *a, struct mempolicy *b);
127 static inline int mpol_equal(struct mempolicy *a, struct mempolicy *b)
128 {
129         if (a == b)
130                 return 1;
131         return __mpol_equal(a, b);
132 }
133
134 /* Could later add inheritance of the process policy here. */
135
136 #define mpol_set_vma_default(vma) ((vma)->vm_policy = NULL)
137
138 /*
139  * Tree of shared policies for a shared memory region.
140  * Maintain the policies in a pseudo mm that contains vmas. The vmas
141  * carry the policy. As a special twist the pseudo mm is indexed in pages, not
142  * bytes, so that we can work with shared memory segments bigger than
143  * unsigned long.
144  */
145
146 struct sp_node {
147         struct rb_node nd;
148         unsigned long start, end;
149         struct mempolicy *policy;
150 };
151
152 struct shared_policy {
153         struct rb_root root;
154         spinlock_t lock;
155 };
156
157 void mpol_shared_policy_init(struct shared_policy *info, unsigned short policy,
158                                 unsigned short flags, nodemask_t *nodes);
159 int mpol_set_shared_policy(struct shared_policy *info,
160                                 struct vm_area_struct *vma,
161                                 struct mempolicy *new);
162 void mpol_free_shared_policy(struct shared_policy *p);
163 struct mempolicy *mpol_shared_policy_lookup(struct shared_policy *sp,
164                                             unsigned long idx);
165
166 extern void numa_default_policy(void);
167 extern void numa_policy_init(void);
168 extern void mpol_rebind_task(struct task_struct *tsk,
169                                         const nodemask_t *new);
170 extern void mpol_rebind_mm(struct mm_struct *mm, nodemask_t *new);
171 extern void mpol_fix_fork_child_flag(struct task_struct *p);
172
173 extern struct mempolicy default_policy;
174 extern struct zonelist *huge_zonelist(struct vm_area_struct *vma,
175                                 unsigned long addr, gfp_t gfp_flags,
176                                 struct mempolicy **mpol, nodemask_t **nodemask);
177 extern unsigned slab_node(struct mempolicy *policy);
178
179 extern enum zone_type policy_zone;
180
181 static inline void check_highest_zone(enum zone_type k)
182 {
183         if (k > policy_zone && k != ZONE_MOVABLE)
184                 policy_zone = k;
185 }
186
187 int do_migrate_pages(struct mm_struct *mm,
188         const nodemask_t *from_nodes, const nodemask_t *to_nodes, int flags);
189
190 #else
191
192 struct mempolicy {};
193
194 static inline int mpol_equal(struct mempolicy *a, struct mempolicy *b)
195 {
196         return 1;
197 }
198
199 #define mpol_set_vma_default(vma) do {} while(0)
200
201 static inline void mpol_free(struct mempolicy *p)
202 {
203 }
204
205 static inline void mpol_get(struct mempolicy *pol)
206 {
207 }
208
209 static inline struct mempolicy *mpol_copy(struct mempolicy *old)
210 {
211         return NULL;
212 }
213
214 struct shared_policy {};
215
216 static inline int mpol_set_shared_policy(struct shared_policy *info,
217                                         struct vm_area_struct *vma,
218                                         struct mempolicy *new)
219 {
220         return -EINVAL;
221 }
222
223 static inline void mpol_shared_policy_init(struct shared_policy *info,
224                 unsigned short policy, unsigned short flags, nodemask_t *nodes)
225 {
226 }
227
228 static inline void mpol_free_shared_policy(struct shared_policy *p)
229 {
230 }
231
232 static inline struct mempolicy *
233 mpol_shared_policy_lookup(struct shared_policy *sp, unsigned long idx)
234 {
235         return NULL;
236 }
237
238 #define vma_policy(vma) NULL
239 #define vma_set_policy(vma, pol) do {} while(0)
240
241 static inline void numa_policy_init(void)
242 {
243 }
244
245 static inline void numa_default_policy(void)
246 {
247 }
248
249 static inline void mpol_rebind_task(struct task_struct *tsk,
250                                         const nodemask_t *new)
251 {
252 }
253
254 static inline void mpol_rebind_mm(struct mm_struct *mm, nodemask_t *new)
255 {
256 }
257
258 static inline void mpol_fix_fork_child_flag(struct task_struct *p)
259 {
260 }
261
262 static inline struct zonelist *huge_zonelist(struct vm_area_struct *vma,
263                                 unsigned long addr, gfp_t gfp_flags,
264                                 struct mempolicy **mpol, nodemask_t **nodemask)
265 {
266         *mpol = NULL;
267         *nodemask = NULL;
268         return node_zonelist(0, gfp_flags);
269 }
270
271 static inline int do_migrate_pages(struct mm_struct *mm,
272                         const nodemask_t *from_nodes,
273                         const nodemask_t *to_nodes, int flags)
274 {
275         return 0;
276 }
277
278 static inline void check_highest_zone(int k)
279 {
280 }
281 #endif /* CONFIG_NUMA */
282 #endif /* __KERNEL__ */
283
284 #endif