2010-03-12から1日間の記事一覧

正規表現が不要になりました。

TinySegmenter for c++(cpp) が正規表現なくても動くようになりました。 http://code.google.com/p/tinysegmenter-cpp/現在 sjis 依存ですが、正規表現なしで動きます。 TinySegmenter自体がそもそもあんまり正規表現を使っていなかったので、数字演算に置き…

色々修正 ver 0.35

sjisの漢字コードの開始と終端の指定が甘かったので修正しました。あと、オリジナルでは数字のパースが少し変だったので修正しました。 オリジナル: 256 → 2 | 5 | 6 修正版 256 → 256小数点も数字として認識されなかったので修正しました。 オリジナル: 1.5…

文字列比較高速化とLinux対応

文字列比較を高速にしました、ついでにLinux(gcc4)対応しました。 http://code.google.com/p/tinysegmenter-cpp/最初、こんなマクロを作って実行前に展開されて定数になってくれたらいいなと思っていたんですけど、 #define STRING_TO_ULONG(p) \ ( \ (*(((u…

TinySegmenter for c++(cpp)

TinySegmenter という javascript だけで作られたコンパクトな分かち書きソフトウェアをC++に移植するプロジェクトを作ってみるテスト。とりあえず、 IRegExp の正規表現を使った windows 版をリリース。 http://code.google.com/p/tinysegmenter-cpp/Linux…