gennmtab.c 9.3 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433
  1. /*
  2. Copyright (c) 1998, 1999 Thai Open Source Software Center Ltd
  3. See the file copying.txt for copying permission.
  4. */
  5. #include <string.h>
  6. #include <stdio.h>
  7. #include <stddef.h>
  8. #include "xmlrpc_config.h"
  9. struct range {
  10. int start;
  11. int end;
  12. };
  13. struct range nmstrt[] = {
  14. { '_', 0 },
  15. { ':', 0 },
  16. /* BaseChar */
  17. { 0x0041, 0x005a },
  18. { 0x0061, 0x007a },
  19. { 0x00c0, 0x00d6 },
  20. { 0x00d8, 0x00f6 },
  21. { 0x00f8, 0x00ff },
  22. { 0x0100, 0x0131 },
  23. { 0x0134, 0x013e },
  24. { 0x0141, 0x0148 },
  25. { 0x014a, 0x017e },
  26. { 0x0180, 0x01c3 },
  27. { 0x01cd, 0x01f0 },
  28. { 0x01f4, 0x01f5 },
  29. { 0x01fa, 0x0217 },
  30. { 0x0250, 0x02a8 },
  31. { 0x02bb, 0x02c1 },
  32. { 0x0386, 0 },
  33. { 0x0388, 0x038a },
  34. { 0x038c, 0 },
  35. { 0x038e, 0x03a1 },
  36. { 0x03a3, 0x03ce },
  37. { 0x03d0, 0x03d6 },
  38. { 0x03da, 0 },
  39. { 0x03dc, 0 },
  40. { 0x03de, 0 },
  41. { 0x03e0, 0 },
  42. { 0x03e2, 0x03f3 },
  43. { 0x0401, 0x040c },
  44. { 0x040e, 0x044f },
  45. { 0x0451, 0x045c },
  46. { 0x045e, 0x0481 },
  47. { 0x0490, 0x04c4 },
  48. { 0x04c7, 0x04c8 },
  49. { 0x04cb, 0x04cc },
  50. { 0x04d0, 0x04eb },
  51. { 0x04ee, 0x04f5 },
  52. { 0x04f8, 0x04f9 },
  53. { 0x0531, 0x0556 },
  54. { 0x0559, 0 },
  55. { 0x0561, 0x0586 },
  56. { 0x05d0, 0x05ea },
  57. { 0x05f0, 0x05f2 },
  58. { 0x0621, 0x063a },
  59. { 0x0641, 0x064a },
  60. { 0x0671, 0x06b7 },
  61. { 0x06ba, 0x06be },
  62. { 0x06c0, 0x06ce },
  63. { 0x06d0, 0x06d3 },
  64. { 0x06d5, 0 },
  65. { 0x06e5, 0x06e6 },
  66. { 0x0905, 0x0939 },
  67. { 0x093d, 0 },
  68. { 0x0958, 0x0961 },
  69. { 0x0985, 0x098c },
  70. { 0x098f, 0x0990 },
  71. { 0x0993, 0x09a8 },
  72. { 0x09aa, 0x09b0 },
  73. { 0x09b2, 0 },
  74. { 0x09b6, 0x09b9 },
  75. { 0x09dc, 0x09dd },
  76. { 0x09df, 0x09e1 },
  77. { 0x09f0, 0x09f1 },
  78. { 0x0a05, 0x0a0a },
  79. { 0x0a0f, 0x0a10 },
  80. { 0x0a13, 0x0a28 },
  81. { 0x0a2a, 0x0a30 },
  82. { 0x0a32, 0x0a33 },
  83. { 0x0a35, 0x0a36 },
  84. { 0x0a38, 0x0a39 },
  85. { 0x0a59, 0x0a5c },
  86. { 0x0a5e, 0 },
  87. { 0x0a72, 0x0a74 },
  88. { 0x0a85, 0x0a8b },
  89. { 0x0a8d, 0 },
  90. { 0x0a8f, 0x0a91 },
  91. { 0x0a93, 0x0aa8 },
  92. { 0x0aaa, 0x0ab0 },
  93. { 0x0ab2, 0x0ab3 },
  94. { 0x0ab5, 0x0ab9 },
  95. { 0x0abd, 0 },
  96. { 0x0ae0, 0 },
  97. { 0x0b05, 0x0b0c },
  98. { 0x0b0f, 0x0b10 },
  99. { 0x0b13, 0x0b28 },
  100. { 0x0b2a, 0x0b30 },
  101. { 0x0b32, 0x0b33 },
  102. { 0x0b36, 0x0b39 },
  103. { 0x0b3d, 0 },
  104. { 0x0b5c, 0x0b5d },
  105. { 0x0b5f, 0x0b61 },
  106. { 0x0b85, 0x0b8a },
  107. { 0x0b8e, 0x0b90 },
  108. { 0x0b92, 0x0b95 },
  109. { 0x0b99, 0x0b9a },
  110. { 0x0b9c, 0 },
  111. { 0x0b9e, 0x0b9f },
  112. { 0x0ba3, 0x0ba4 },
  113. { 0x0ba8, 0x0baa },
  114. { 0x0bae, 0x0bb5 },
  115. { 0x0bb7, 0x0bb9 },
  116. { 0x0c05, 0x0c0c },
  117. { 0x0c0e, 0x0c10 },
  118. { 0x0c12, 0x0c28 },
  119. { 0x0c2a, 0x0c33 },
  120. { 0x0c35, 0x0c39 },
  121. { 0x0c60, 0x0c61 },
  122. { 0x0c85, 0x0c8c },
  123. { 0x0c8e, 0x0c90 },
  124. { 0x0c92, 0x0ca8 },
  125. { 0x0caa, 0x0cb3 },
  126. { 0x0cb5, 0x0cb9 },
  127. { 0x0cde, 0 },
  128. { 0x0ce0, 0x0ce1 },
  129. { 0x0d05, 0x0d0c },
  130. { 0x0d0e, 0x0d10 },
  131. { 0x0d12, 0x0d28 },
  132. { 0x0d2a, 0x0d39 },
  133. { 0x0d60, 0x0d61 },
  134. { 0x0e01, 0x0e2e },
  135. { 0x0e30, 0 },
  136. { 0x0e32, 0x0e33 },
  137. { 0x0e40, 0x0e45 },
  138. { 0x0e81, 0x0e82 },
  139. { 0x0e84, 0 },
  140. { 0x0e87, 0x0e88 },
  141. { 0x0e8a, 0 },
  142. { 0x0e8d, 0 },
  143. { 0x0e94, 0x0e97 },
  144. { 0x0e99, 0x0e9f },
  145. { 0x0ea1, 0x0ea3 },
  146. { 0x0ea5, 0 },
  147. { 0x0ea7, 0 },
  148. { 0x0eaa, 0x0eab },
  149. { 0x0ead, 0x0eae },
  150. { 0x0eb0, 0 },
  151. { 0x0eb2, 0x0eb3 },
  152. { 0x0ebd, 0 },
  153. { 0x0ec0, 0x0ec4 },
  154. { 0x0f40, 0x0f47 },
  155. { 0x0f49, 0x0f69 },
  156. { 0x10a0, 0x10c5 },
  157. { 0x10d0, 0x10f6 },
  158. { 0x1100, 0 },
  159. { 0x1102, 0x1103 },
  160. { 0x1105, 0x1107 },
  161. { 0x1109, 0 },
  162. { 0x110b, 0x110c },
  163. { 0x110e, 0x1112 },
  164. { 0x113c, 0 },
  165. { 0x113e, 0 },
  166. { 0x1140, 0 },
  167. { 0x114c, 0 },
  168. { 0x114e, 0 },
  169. { 0x1150, 0 },
  170. { 0x1154, 0x1155 },
  171. { 0x1159, 0 },
  172. { 0x115f, 0x1161 },
  173. { 0x1163, 0 },
  174. { 0x1165, 0 },
  175. { 0x1167, 0 },
  176. { 0x1169, 0 },
  177. { 0x116d, 0x116e },
  178. { 0x1172, 0x1173 },
  179. { 0x1175, 0 },
  180. { 0x119e, 0 },
  181. { 0x11a8, 0 },
  182. { 0x11ab, 0 },
  183. { 0x11ae, 0x11af },
  184. { 0x11b7, 0x11b8 },
  185. { 0x11ba, 0 },
  186. { 0x11bc, 0x11c2 },
  187. { 0x11eb, 0 },
  188. { 0x11f0, 0 },
  189. { 0x11f9, 0 },
  190. { 0x1e00, 0x1e9b },
  191. { 0x1ea0, 0x1ef9 },
  192. { 0x1f00, 0x1f15 },
  193. { 0x1f18, 0x1f1d },
  194. { 0x1f20, 0x1f45 },
  195. { 0x1f48, 0x1f4d },
  196. { 0x1f50, 0x1f57 },
  197. { 0x1f59, 0 },
  198. { 0x1f5b, 0 },
  199. { 0x1f5d, 0 },
  200. { 0x1f5f, 0x1f7d },
  201. { 0x1f80, 0x1fb4 },
  202. { 0x1fb6, 0x1fbc },
  203. { 0x1fbe, 0 },
  204. { 0x1fc2, 0x1fc4 },
  205. { 0x1fc6, 0x1fcc },
  206. { 0x1fd0, 0x1fd3 },
  207. { 0x1fd6, 0x1fdb },
  208. { 0x1fe0, 0x1fec },
  209. { 0x1ff2, 0x1ff4 },
  210. { 0x1ff6, 0x1ffc },
  211. { 0x2126, 0 },
  212. { 0x212a, 0x212b },
  213. { 0x212e, 0 },
  214. { 0x2180, 0x2182 },
  215. { 0x3041, 0x3094 },
  216. { 0x30a1, 0x30fa },
  217. { 0x3105, 0x312c },
  218. { 0xac00, 0xd7a3 },
  219. /* Ideographic */
  220. { 0x4e00, 0x9fa5 },
  221. { 0x3007, 0 },
  222. { 0x3021, 0x3029 },
  223. };
  224. /* name chars that are not name start chars */
  225. struct range name[] = {
  226. { '.', 0 },
  227. { '-', 0 },
  228. /* CombiningChar */
  229. { 0x0300, 0x0345 },
  230. { 0x0360, 0x0361 },
  231. { 0x0483, 0x0486 },
  232. { 0x0591, 0x05a1 },
  233. { 0x05a3, 0x05b9 },
  234. { 0x05bb, 0x05bd },
  235. { 0x05bf, 0 },
  236. { 0x05c1, 0x05c2 },
  237. { 0x05c4, 0 },
  238. { 0x064b, 0x0652 },
  239. { 0x0670, 0 },
  240. { 0x06d6, 0x06dc },
  241. { 0x06dd, 0x06df },
  242. { 0x06e0, 0x06e4 },
  243. { 0x06e7, 0x06e8 },
  244. { 0x06ea, 0x06ed },
  245. { 0x0901, 0x0903 },
  246. { 0x093c, 0 },
  247. { 0x093e, 0x094c },
  248. { 0x094d, 0 },
  249. { 0x0951, 0x0954 },
  250. { 0x0962, 0x0963 },
  251. { 0x0981, 0x0983 },
  252. { 0x09bc, 0 },
  253. { 0x09be, 0 },
  254. { 0x09bf, 0 },
  255. { 0x09c0, 0x09c4 },
  256. { 0x09c7, 0x09c8 },
  257. { 0x09cb, 0x09cd },
  258. { 0x09d7, 0 },
  259. { 0x09e2, 0x09e3 },
  260. { 0x0a02, 0 },
  261. { 0x0a3c, 0 },
  262. { 0x0a3e, 0 },
  263. { 0x0a3f, 0 },
  264. { 0x0a40, 0x0a42 },
  265. { 0x0a47, 0x0a48 },
  266. { 0x0a4b, 0x0a4d },
  267. { 0x0a70, 0x0a71 },
  268. { 0x0a81, 0x0a83 },
  269. { 0x0abc, 0 },
  270. { 0x0abe, 0x0ac5 },
  271. { 0x0ac7, 0x0ac9 },
  272. { 0x0acb, 0x0acd },
  273. { 0x0b01, 0x0b03 },
  274. { 0x0b3c, 0 },
  275. { 0x0b3e, 0x0b43 },
  276. { 0x0b47, 0x0b48 },
  277. { 0x0b4b, 0x0b4d },
  278. { 0x0b56, 0x0b57 },
  279. { 0x0b82, 0x0b83 },
  280. { 0x0bbe, 0x0bc2 },
  281. { 0x0bc6, 0x0bc8 },
  282. { 0x0bca, 0x0bcd },
  283. { 0x0bd7, 0 },
  284. { 0x0c01, 0x0c03 },
  285. { 0x0c3e, 0x0c44 },
  286. { 0x0c46, 0x0c48 },
  287. { 0x0c4a, 0x0c4d },
  288. { 0x0c55, 0x0c56 },
  289. { 0x0c82, 0x0c83 },
  290. { 0x0cbe, 0x0cc4 },
  291. { 0x0cc6, 0x0cc8 },
  292. { 0x0cca, 0x0ccd },
  293. { 0x0cd5, 0x0cd6 },
  294. { 0x0d02, 0x0d03 },
  295. { 0x0d3e, 0x0d43 },
  296. { 0x0d46, 0x0d48 },
  297. { 0x0d4a, 0x0d4d },
  298. { 0x0d57, 0 },
  299. { 0x0e31, 0 },
  300. { 0x0e34, 0x0e3a },
  301. { 0x0e47, 0x0e4e },
  302. { 0x0eb1, 0 },
  303. { 0x0eb4, 0x0eb9 },
  304. { 0x0ebb, 0x0ebc },
  305. { 0x0ec8, 0x0ecd },
  306. { 0x0f18, 0x0f19 },
  307. { 0x0f35, 0 },
  308. { 0x0f37, 0 },
  309. { 0x0f39, 0 },
  310. { 0x0f3e, 0 },
  311. { 0x0f3f, 0 },
  312. { 0x0f71, 0x0f84 },
  313. { 0x0f86, 0x0f8b },
  314. { 0x0f90, 0x0f95 },
  315. { 0x0f97, 0 },
  316. { 0x0f99, 0x0fad },
  317. { 0x0fb1, 0x0fb7 },
  318. { 0x0fb9, 0 },
  319. { 0x20d0, 0x20dc },
  320. { 0x20e1, 0 },
  321. { 0x302a, 0x302f },
  322. { 0x3099, 0 },
  323. { 0x309a, 0 },
  324. /* Digit */
  325. { 0x0030, 0x0039 },
  326. { 0x0660, 0x0669 },
  327. { 0x06f0, 0x06f9 },
  328. { 0x0966, 0x096f },
  329. { 0x09e6, 0x09ef },
  330. { 0x0a66, 0x0a6f },
  331. { 0x0ae6, 0x0aef },
  332. { 0x0b66, 0x0b6f },
  333. { 0x0be7, 0x0bef },
  334. { 0x0c66, 0x0c6f },
  335. { 0x0ce6, 0x0cef },
  336. { 0x0d66, 0x0d6f },
  337. { 0x0e50, 0x0e59 },
  338. { 0x0ed0, 0x0ed9 },
  339. { 0x0f20, 0x0f29 },
  340. /* Extender */
  341. { 0xb7 , 0 },
  342. { 0x02d0, 0 },
  343. { 0x02d1, 0 },
  344. { 0x0387, 0 },
  345. { 0x0640, 0 },
  346. { 0x0e46, 0 },
  347. { 0x0ec6, 0 },
  348. { 0x3005, 0 },
  349. { 0x3031, 0x3035 },
  350. { 0x309d, 0x309e },
  351. { 0x30fc, 0x30fe },
  352. };
  353. static void
  354. setTab(char *tab, struct range *ranges, size_t nRanges)
  355. {
  356. size_t i;
  357. int j;
  358. for (i = 0; i < nRanges; i++) {
  359. if (ranges[i].end) {
  360. for (j = ranges[i].start; j <= ranges[i].end; j++)
  361. tab[j] = 1;
  362. }
  363. else
  364. tab[ranges[i].start] = 1;
  365. }
  366. }
  367. static void
  368. printTabs(char *tab)
  369. {
  370. int nBitmaps = 2;
  371. int i, j, k;
  372. unsigned char pageIndex[512];
  373. printf(
  374. "static const unsigned namingBitmap[] = {\n\
  375. 0x00000000, 0x00000000, 0x00000000, 0x00000000,\n\
  376. 0x00000000, 0x00000000, 0x00000000, 0x00000000,\n\
  377. 0xFFFFFFFF, 0xFFFFFFFF, 0xFFFFFFFF, 0xFFFFFFFF,\n\
  378. 0xFFFFFFFF, 0xFFFFFFFF, 0xFFFFFFFF, 0xFFFFFFFF,\n");
  379. for (i = 0; i < 512; i++) {
  380. int kind = tab[i*256];
  381. for (j = 1; j < 256; j++)
  382. if (tab[i*256 +j] != kind) {
  383. kind = -1;
  384. break;
  385. }
  386. if (i >= 256 && memcmp(tab + (i - 256)*256, tab + i*256, 256) == 0)
  387. pageIndex[i] = pageIndex[i - 256];
  388. else if (kind == -1) {
  389. pageIndex[i] = nBitmaps++;
  390. for (j = 0; j < 8; j++) {
  391. unsigned val = 0;
  392. for (k = 0; k < 32; k++) {
  393. if (tab[i*256 + j*32 +k])
  394. val |= (1 << k);
  395. }
  396. printf("0x%08X,", val);
  397. putchar((((j + 1) & 3) == 0) ? '\n' : ' ');
  398. }
  399. }
  400. else
  401. pageIndex[i] = kind;
  402. }
  403. printf("};\n");
  404. printf("static const unsigned char nmstrtPages[] = {\n");
  405. for (i = 0; i < 512; i++) {
  406. if (i == 256)
  407. printf("};\nstatic const unsigned char namePages[] = {\n");
  408. printf("0x%02X,", pageIndex[i]);
  409. putchar((((i + 1) & 7) == 0) ? '\n' : ' ');
  410. }
  411. printf("};\n");
  412. }
  413. int
  414. main(int const argc ATTR_UNUSED,
  415. char ** const argv ATTR_UNUSED) {
  416. char tab[2*65536];
  417. memset(tab, 0, 65536);
  418. setTab(tab, nmstrt, sizeof(nmstrt)/sizeof(nmstrt[0]));
  419. memcpy(tab + 65536, tab, 65536);
  420. setTab(tab + 65536, name, sizeof(name)/sizeof(name[0]));
  421. printTabs(tab);
  422. return 0;
  423. }