unicode 汉字表示不唯一的问题 (cjk字符集)

update:

遇到的汉字:

丹:63838

李:63969

昨天写的正则发现死活识别不了 “年”字…

放到unicode编码转化公式 查了下发现竟然是不同的字orz..

其实猜想到也许是日文的”年”…结果查询了下发现是韩文的锅?

具体参考为何Unicode中有字形完全相同的CJK字符?

以及兼容汉字的参考表:UF900