TinySegmenter.NET : 分かち書きを行うC#のクラス

TinySegmenter.NETとは?

TinySegmenterというJavascriptだけで書かれた日本語分かち書きソフトウェアをC#に移植したものです。分かち書きというのは、文章を解析して語に分けることです。

使い方

分かち書きを行うには、次のようにします。

  1. TinySegmenterクラスのインスタンスを作成します。
  2. Segmentメソッドのパラメータに分かち書きをしたい文章(String型)を渡します。
  3. SegmentメソッドがString型の配列を返します。これが分かち書きされた結果です。

以下に、具体例を示します。

  1
  2
  3
  4
  5
  6
  7
  8
  9
//分かち書きをする文章
string text = "今日はいい天気ですね。";
 
//TinySegmenterオブジェクトを作成する
TinySegmenterDotNet.TinySegmenter seg = new TinySegmenterDotNet.TinySegmenter();
//分かち書きを行う
string[] words = seg.Segment(text);
//"|"で区切って表示する
Console.WriteLine(string.Join("|", words));

このコードを実行すると、以下のように表示されます。

今日|は|いい|天気|です|ね|。

ライセンス

TinySegmenterと同じ、修正BSDライセンスです。

著作権者

著作権者の情報は、ソースの上部に記述されています。

ダウンロード

各バージョンの情報、ソース、ダウンロードについては、以下の各バージョンのページをご覧ください。

新バージョンの投稿

TinySegmenter.NETの修正、改変等は、ライセンスの許す範囲で、自由にやっていただいてかまいません。もしTinySegmenter.NETを修正していただき、公開していただけるのであれば、新しいバージョンとして、下のフォームを使用してご投稿ください。その際は、次のようにして投稿してください。

  • 「バージョン」は、「(基になったTinySegmenterのバージョン).(数字)」とし、すでに存在しているバージョンと被らないような値にしてください。例えば、バージョン 0.1.1 はバージョン 0.1 のTinySegmenterを移植したものですので、もし 0.1.1 を修正したものを投稿するのであれば、そのバージョンは 0.1.2 のようにしてください。
  • 「作者名」には、あなたのお名前を記入して下さい。
  • 「説明」には、修正点などを記入して下さい。
  • 「ソース」にソースコードを記入して下さい。(現在ファイルのアップロードはできません。)
  • ソースの上部には、あなたの著作権情報を追記してください。
  • ソースの前後の改行は削除してください。
バージョン
作者名
説明
ソース

その他

TinySegmenterをVB.NETに移植した「TinySegmenter VB.NET」もあります。

コメント



ページ情報
  • カテゴリ : .NET
  • 作成日 : 2010-11-23 (火) 23:40:53
  • 作成者 : DOBON!
  • 最終編集日 : 2010-11-24 (水) 00:08:58
  • 最終編集者 : DOBON!
[ トップ ]   [ 編集 | 凍結 | 差分 | バックアップ | 添付 | 複製 | 名前変更 | リロード ]   [ 新規 | 子ページ作成 | 一覧 | 単語検索 | 最終更新 | ヘルプ ]