Unevictable LRU Infrastructure
[linux-2.6.git] / include / linux / page-flags.h
1 /*
2  * Macros for manipulating and testing page->flags
3  */
4
5 #ifndef PAGE_FLAGS_H
6 #define PAGE_FLAGS_H
7
8 #include <linux/types.h>
9 #ifndef __GENERATING_BOUNDS_H
10 #include <linux/mm_types.h>
11 #include <linux/bounds.h>
12 #endif /* !__GENERATING_BOUNDS_H */
13
14 /*
15  * Various page->flags bits:
16  *
17  * PG_reserved is set for special pages, which can never be swapped out. Some
18  * of them might not even exist (eg empty_bad_page)...
19  *
20  * The PG_private bitflag is set on pagecache pages if they contain filesystem
21  * specific data (which is normally at page->private). It can be used by
22  * private allocations for its own usage.
23  *
24  * During initiation of disk I/O, PG_locked is set. This bit is set before I/O
25  * and cleared when writeback _starts_ or when read _completes_. PG_writeback
26  * is set before writeback starts and cleared when it finishes.
27  *
28  * PG_locked also pins a page in pagecache, and blocks truncation of the file
29  * while it is held.
30  *
31  * page_waitqueue(page) is a wait queue of all tasks waiting for the page
32  * to become unlocked.
33  *
34  * PG_uptodate tells whether the page's contents is valid.  When a read
35  * completes, the page becomes uptodate, unless a disk I/O error happened.
36  *
37  * PG_referenced, PG_reclaim are used for page reclaim for anonymous and
38  * file-backed pagecache (see mm/vmscan.c).
39  *
40  * PG_error is set to indicate that an I/O error occurred on this page.
41  *
42  * PG_arch_1 is an architecture specific page state bit.  The generic code
43  * guarantees that this bit is cleared for a page when it first is entered into
44  * the page cache.
45  *
46  * PG_highmem pages are not permanently mapped into the kernel virtual address
47  * space, they need to be kmapped separately for doing IO on the pages.  The
48  * struct page (these bits with information) are always mapped into kernel
49  * address space...
50  *
51  * PG_buddy is set to indicate that the page is free and in the buddy system
52  * (see mm/page_alloc.c).
53  *
54  */
55
56 /*
57  * Don't use the *_dontuse flags.  Use the macros.  Otherwise you'll break
58  * locked- and dirty-page accounting.
59  *
60  * The page flags field is split into two parts, the main flags area
61  * which extends from the low bits upwards, and the fields area which
62  * extends from the high bits downwards.
63  *
64  *  | FIELD | ... | FLAGS |
65  *  N-1           ^       0
66  *               (NR_PAGEFLAGS)
67  *
68  * The fields area is reserved for fields mapping zone, node (for NUMA) and
69  * SPARSEMEM section (for variants of SPARSEMEM that require section ids like
70  * SPARSEMEM_EXTREME with !SPARSEMEM_VMEMMAP).
71  */
72 enum pageflags {
73         PG_locked,              /* Page is locked. Don't touch. */
74         PG_error,
75         PG_referenced,
76         PG_uptodate,
77         PG_dirty,
78         PG_lru,
79         PG_active,
80         PG_slab,
81         PG_owner_priv_1,        /* Owner use. If pagecache, fs may use*/
82         PG_arch_1,
83         PG_reserved,
84         PG_private,             /* If pagecache, has fs-private data */
85         PG_writeback,           /* Page is under writeback */
86 #ifdef CONFIG_PAGEFLAGS_EXTENDED
87         PG_head,                /* A head page */
88         PG_tail,                /* A tail page */
89 #else
90         PG_compound,            /* A compound page */
91 #endif
92         PG_swapcache,           /* Swap page: swp_entry_t in private */
93         PG_mappedtodisk,        /* Has blocks allocated on-disk */
94         PG_reclaim,             /* To be reclaimed asap */
95         PG_buddy,               /* Page is free, on buddy lists */
96         PG_swapbacked,          /* Page is backed by RAM/swap */
97 #ifdef CONFIG_UNEVICTABLE_LRU
98         PG_unevictable,         /* Page is "unevictable"  */
99 #endif
100 #ifdef CONFIG_IA64_UNCACHED_ALLOCATOR
101         PG_uncached,            /* Page has been mapped as uncached */
102 #endif
103         __NR_PAGEFLAGS,
104
105         /* Filesystems */
106         PG_checked = PG_owner_priv_1,
107
108         /* XEN */
109         PG_pinned = PG_owner_priv_1,
110         PG_savepinned = PG_dirty,
111
112         /* SLOB */
113         PG_slob_page = PG_active,
114         PG_slob_free = PG_private,
115
116         /* SLUB */
117         PG_slub_frozen = PG_active,
118         PG_slub_debug = PG_error,
119 };
120
121 #ifndef __GENERATING_BOUNDS_H
122
123 /*
124  * Macros to create function definitions for page flags
125  */
126 #define TESTPAGEFLAG(uname, lname)                                      \
127 static inline int Page##uname(struct page *page)                        \
128                         { return test_bit(PG_##lname, &page->flags); }
129
130 #define SETPAGEFLAG(uname, lname)                                       \
131 static inline void SetPage##uname(struct page *page)                    \
132                         { set_bit(PG_##lname, &page->flags); }
133
134 #define CLEARPAGEFLAG(uname, lname)                                     \
135 static inline void ClearPage##uname(struct page *page)                  \
136                         { clear_bit(PG_##lname, &page->flags); }
137
138 #define __SETPAGEFLAG(uname, lname)                                     \
139 static inline void __SetPage##uname(struct page *page)                  \
140                         { __set_bit(PG_##lname, &page->flags); }
141
142 #define __CLEARPAGEFLAG(uname, lname)                                   \
143 static inline void __ClearPage##uname(struct page *page)                \
144                         { __clear_bit(PG_##lname, &page->flags); }
145
146 #define TESTSETFLAG(uname, lname)                                       \
147 static inline int TestSetPage##uname(struct page *page)                 \
148                 { return test_and_set_bit(PG_##lname, &page->flags); }
149
150 #define TESTCLEARFLAG(uname, lname)                                     \
151 static inline int TestClearPage##uname(struct page *page)               \
152                 { return test_and_clear_bit(PG_##lname, &page->flags); }
153
154
155 #define PAGEFLAG(uname, lname) TESTPAGEFLAG(uname, lname)               \
156         SETPAGEFLAG(uname, lname) CLEARPAGEFLAG(uname, lname)
157
158 #define __PAGEFLAG(uname, lname) TESTPAGEFLAG(uname, lname)             \
159         __SETPAGEFLAG(uname, lname)  __CLEARPAGEFLAG(uname, lname)
160
161 #define PAGEFLAG_FALSE(uname)                                           \
162 static inline int Page##uname(struct page *page)                        \
163                         { return 0; }
164
165 #define TESTSCFLAG(uname, lname)                                        \
166         TESTSETFLAG(uname, lname) TESTCLEARFLAG(uname, lname)
167
168 #define SETPAGEFLAG_NOOP(uname)                                         \
169 static inline void SetPage##uname(struct page *page) {  }
170
171 #define CLEARPAGEFLAG_NOOP(uname)                                       \
172 static inline void ClearPage##uname(struct page *page) {  }
173
174 #define __CLEARPAGEFLAG_NOOP(uname)                                     \
175 static inline void __ClearPage##uname(struct page *page) {  }
176
177 #define TESTCLEARFLAG_FALSE(uname)                                      \
178 static inline int TestClearPage##uname(struct page *page) { return 0; }
179
180 struct page;    /* forward declaration */
181
182 TESTPAGEFLAG(Locked, locked)
183 PAGEFLAG(Error, error)
184 PAGEFLAG(Referenced, referenced) TESTCLEARFLAG(Referenced, referenced)
185 PAGEFLAG(Dirty, dirty) TESTSCFLAG(Dirty, dirty) __CLEARPAGEFLAG(Dirty, dirty)
186 PAGEFLAG(LRU, lru) __CLEARPAGEFLAG(LRU, lru)
187 PAGEFLAG(Active, active) __CLEARPAGEFLAG(Active, active)
188         TESTCLEARFLAG(Active, active)
189 __PAGEFLAG(Slab, slab)
190 PAGEFLAG(Checked, checked)              /* Used by some filesystems */
191 PAGEFLAG(Pinned, pinned) TESTSCFLAG(Pinned, pinned)     /* Xen */
192 PAGEFLAG(SavePinned, savepinned);                       /* Xen */
193 PAGEFLAG(Reserved, reserved) __CLEARPAGEFLAG(Reserved, reserved)
194 PAGEFLAG(Private, private) __CLEARPAGEFLAG(Private, private)
195         __SETPAGEFLAG(Private, private)
196 PAGEFLAG(SwapBacked, swapbacked) __CLEARPAGEFLAG(SwapBacked, swapbacked)
197
198 __PAGEFLAG(SlobPage, slob_page)
199 __PAGEFLAG(SlobFree, slob_free)
200
201 __PAGEFLAG(SlubFrozen, slub_frozen)
202 __PAGEFLAG(SlubDebug, slub_debug)
203
204 /*
205  * Only test-and-set exist for PG_writeback.  The unconditional operators are
206  * risky: they bypass page accounting.
207  */
208 TESTPAGEFLAG(Writeback, writeback) TESTSCFLAG(Writeback, writeback)
209 __PAGEFLAG(Buddy, buddy)
210 PAGEFLAG(MappedToDisk, mappedtodisk)
211
212 /* PG_readahead is only used for file reads; PG_reclaim is only for writes */
213 PAGEFLAG(Reclaim, reclaim) TESTCLEARFLAG(Reclaim, reclaim)
214 PAGEFLAG(Readahead, reclaim)            /* Reminder to do async read-ahead */
215
216 #ifdef CONFIG_HIGHMEM
217 /*
218  * Must use a macro here due to header dependency issues. page_zone() is not
219  * available at this point.
220  */
221 #define PageHighMem(__p) is_highmem(page_zone(__p))
222 #else
223 PAGEFLAG_FALSE(HighMem)
224 #endif
225
226 #ifdef CONFIG_SWAP
227 PAGEFLAG(SwapCache, swapcache)
228 #else
229 PAGEFLAG_FALSE(SwapCache)
230 #endif
231
232 #ifdef CONFIG_UNEVICTABLE_LRU
233 PAGEFLAG(Unevictable, unevictable) __CLEARPAGEFLAG(Unevictable, unevictable)
234         TESTCLEARFLAG(Unevictable, unevictable)
235 #else
236 PAGEFLAG_FALSE(Unevictable) TESTCLEARFLAG_FALSE(Unevictable)
237         SETPAGEFLAG_NOOP(Unevictable) CLEARPAGEFLAG_NOOP(Unevictable)
238         __CLEARPAGEFLAG_NOOP(Unevictable)
239 #endif
240
241 #ifdef CONFIG_IA64_UNCACHED_ALLOCATOR
242 PAGEFLAG(Uncached, uncached)
243 #else
244 PAGEFLAG_FALSE(Uncached)
245 #endif
246
247 static inline int PageUptodate(struct page *page)
248 {
249         int ret = test_bit(PG_uptodate, &(page)->flags);
250
251         /*
252          * Must ensure that the data we read out of the page is loaded
253          * _after_ we've loaded page->flags to check for PageUptodate.
254          * We can skip the barrier if the page is not uptodate, because
255          * we wouldn't be reading anything from it.
256          *
257          * See SetPageUptodate() for the other side of the story.
258          */
259         if (ret)
260                 smp_rmb();
261
262         return ret;
263 }
264
265 static inline void __SetPageUptodate(struct page *page)
266 {
267         smp_wmb();
268         __set_bit(PG_uptodate, &(page)->flags);
269 }
270
271 static inline void SetPageUptodate(struct page *page)
272 {
273 #ifdef CONFIG_S390
274         if (!test_and_set_bit(PG_uptodate, &page->flags))
275                 page_clear_dirty(page);
276 #else
277         /*
278          * Memory barrier must be issued before setting the PG_uptodate bit,
279          * so that all previous stores issued in order to bring the page
280          * uptodate are actually visible before PageUptodate becomes true.
281          *
282          * s390 doesn't need an explicit smp_wmb here because the test and
283          * set bit already provides full barriers.
284          */
285         smp_wmb();
286         set_bit(PG_uptodate, &(page)->flags);
287 #endif
288 }
289
290 CLEARPAGEFLAG(Uptodate, uptodate)
291
292 extern void cancel_dirty_page(struct page *page, unsigned int account_size);
293
294 int test_clear_page_writeback(struct page *page);
295 int test_set_page_writeback(struct page *page);
296
297 static inline void set_page_writeback(struct page *page)
298 {
299         test_set_page_writeback(page);
300 }
301
302 #ifdef CONFIG_PAGEFLAGS_EXTENDED
303 /*
304  * System with lots of page flags available. This allows separate
305  * flags for PageHead() and PageTail() checks of compound pages so that bit
306  * tests can be used in performance sensitive paths. PageCompound is
307  * generally not used in hot code paths.
308  */
309 __PAGEFLAG(Head, head)
310 __PAGEFLAG(Tail, tail)
311
312 static inline int PageCompound(struct page *page)
313 {
314         return page->flags & ((1L << PG_head) | (1L << PG_tail));
315
316 }
317 #else
318 /*
319  * Reduce page flag use as much as possible by overlapping
320  * compound page flags with the flags used for page cache pages. Possible
321  * because PageCompound is always set for compound pages and not for
322  * pages on the LRU and/or pagecache.
323  */
324 TESTPAGEFLAG(Compound, compound)
325 __PAGEFLAG(Head, compound)
326
327 /*
328  * PG_reclaim is used in combination with PG_compound to mark the
329  * head and tail of a compound page. This saves one page flag
330  * but makes it impossible to use compound pages for the page cache.
331  * The PG_reclaim bit would have to be used for reclaim or readahead
332  * if compound pages enter the page cache.
333  *
334  * PG_compound & PG_reclaim     => Tail page
335  * PG_compound & ~PG_reclaim    => Head page
336  */
337 #define PG_head_tail_mask ((1L << PG_compound) | (1L << PG_reclaim))
338
339 static inline int PageTail(struct page *page)
340 {
341         return ((page->flags & PG_head_tail_mask) == PG_head_tail_mask);
342 }
343
344 static inline void __SetPageTail(struct page *page)
345 {
346         page->flags |= PG_head_tail_mask;
347 }
348
349 static inline void __ClearPageTail(struct page *page)
350 {
351         page->flags &= ~PG_head_tail_mask;
352 }
353
354 #endif /* !PAGEFLAGS_EXTENDED */
355
356 #ifdef CONFIG_UNEVICTABLE_LRU
357 #define __PG_UNEVICTABLE (1 << PG_unevictable)
358 #else
359 #define __PG_UNEVICTABLE 0
360 #endif
361
362 #define PAGE_FLAGS      (1 << PG_lru   | 1 << PG_private   | 1 << PG_locked | \
363                          1 << PG_buddy | 1 << PG_writeback | \
364                          1 << PG_slab  | 1 << PG_swapcache | 1 << PG_active | \
365                          __PG_UNEVICTABLE)
366
367 /*
368  * Flags checked in bad_page().  Pages on the free list should not have
369  * these flags set.  It they are, there is a problem.
370  */
371 #define PAGE_FLAGS_CLEAR_WHEN_BAD (PAGE_FLAGS | \
372                 1 << PG_reclaim | 1 << PG_dirty | 1 << PG_swapbacked)
373
374 /*
375  * Flags checked when a page is freed.  Pages being freed should not have
376  * these flags set.  It they are, there is a problem.
377  */
378 #define PAGE_FLAGS_CHECK_AT_FREE (PAGE_FLAGS | 1 << PG_reserved)
379
380 /*
381  * Flags checked when a page is prepped for return by the page allocator.
382  * Pages being prepped should not have these flags set.  It they are, there
383  * is a problem.
384  */
385 #define PAGE_FLAGS_CHECK_AT_PREP (PAGE_FLAGS | \
386                 1 << PG_reserved | 1 << PG_dirty | 1 << PG_swapbacked)
387
388 #endif /* !__GENERATING_BOUNDS_H */
389 #endif  /* PAGE_FLAGS_H */