FC2ブログ

本を読む

読書やコンピュータなどに関するメモ

カナ英数字のJIS X 4061ソートをRubyGemsに

 仕事で使い回していた、Rubyでカナ英数字をJIS X 4061(日本語文字列照合順番)順にソートする単純なルーチンを、ライブラリに切り出してまとめました。ついでに自分が使いやすいよう、RubyGemsにリリースしました。

  •  実は初RubyGemsです。

     ユースケースとしては、たとえば書籍の索引データをソートするときに使います。JIS X 4061では、“カ”=“ガ”とか、“ヤ”=“ャ”とか、句読点 < 記号 < 数字 < 英字 < カナとかいった比較順序が決められています。ざっくりいうと、Excelのソート順です。

     なお、漢字から読みを生成して比較する機能はありません。あと、自分のユースケースをカバーできればいいので、JIS X 4061のフルセット対応は狙っていません。

    コメント

    コメントの投稿

    管理者にだけ表示を許可する

    トラックバック

    http://emasaka.blog65.fc2.com/tb.php/1432-10417b7f

     | HOME | 

    Categories

    Recent Entries

    Recent Comments

    Recent Trackbacks

    Appendix

    emasaka

    emasaka

    フリーター。
    連絡先はこのへん

    Monthly


    FC2Ad