• 首先要感谢的是世界上最强大的编辑器——vim,有了它,我修改码表时完全不必碰鼠标,大大减少了右手的负荷,而且在极大程度上提高了我的工作效率,不然我早就坚持不下去了……

    该说说我到底干了些什么了……

    1.修改了部分一级简码,以及增加了极少数二级简码;

    2.逐一处理了带“是”“很”“的”“了”的所有废码(由于是人工处理,所以绝不会错杀例如“众矢之的”之类的词);

    3.添加了极少数新词;

    4.最重要的当然是之前不断提及的逐行精简,把绝大部分重码删去……

    我精简的原则是只修改有重码的码(删除全部废码的工作量实在太大),先删复合词(如“开发公司”等),再删带有简码的(最典型的就是“不是”了……),此外,为了尽量不留下重码,我还会把个别我所认为的低频词(如在ikwh码中的“撰文”与“执委会”)删去,因此个别地方难免会被瘦身过度……

    值得一提的是,我大胆地采取了删除个别单字的全码来减少重码的办法,我的根据是,我用二笔近一年也未曾输入过要输入全码才能上屏的字,而且我仔细看了看码表,发现每个(我所见的)单字的会含一个三码的简码,所以把全码删去应该问题不大……

    精简码表这一环节可以说是告一段落了,接下来,我还打算将其再打磨打磨,着重于增加二级简码与补回个别因瘦身过度所删去的词……

    最后,考虑到这精简版过于粗糙,所以还是等一段时间后再考虑是否共享吧……

  • 帮了我一个大忙……

    [^\x00-\xff]\{2,}\s[^\x00-\xff]\{2,}:匹配码表中含词加词的重码,如"XX XX";

    [^\x00-\xff]\{2,}\(\s[^\x00-\xff]\)\{1,}\(\s\|$\):匹配码表中含词加单字的重码,如"XX X";

    \(\s[^\x00-\xff]\)\{1,}\s[^\x00-\xff]\{2,}:匹配码表中含单字加词的重码,如"X XX"……

    我就这样把类似的所有重码逐个逐个地删去……

    正则表达式真的很强大,等我有空定要学一学!

    另外,还剩下yi开头的码就完成逐行精简码表的伟大尝试了!

  • 还差xyi…… - [轻描淡写]

    2009年10月02日

    就精简完毕了……别看只有3个字母,但以它们开头的编码却占了总的1/5……

  • 今天把哲哲豆码表的qrs这三个字母开头的跟把所有开头为“很”及结尾为“是”“的”“了”都精简处理了一遍,大概看了10000行(占总码表的1/5吧)……

    太累人了!

  • 还剩下…… - [轻描淡写]

    2009年10月01日

    stwxyi这6个字母开头的编码,就能完成因我搬家而搁置的逐行精简哲哲豆伟大尝试!

    估计能在我国庆假期内完成,不过暂时还没发表码表的打算……