« 2005年1月 | トップページ | 2005年3月 »

bwrc

以前からちまちまと作っていた BWCA のパラメータの調整がようやく終わったので、 公開してみる。

ランク符号には、 Distance Coding の簡易版? を使用。 情報源モデルには、 圧縮/伸縮の処理が binarymodel よりも高速な RLE-0 + 0-1-2 Coding + Structured Coding を使っています。

圧縮/伸縮結果: 圧縮率 .. 圧縮サイズ .. 圧縮時間 .. 伸縮時間

圧縮率は、 wfc + binarymodel と同じか少し悪いくらいか。。 まあ bwrc は速度重視なのでこんなもんですかねえ。

| | コメント (0) | トラックバック (0)

CSA - その3

CSAに いくつかプログラムを追加。 これでようやく CSAファイルの作成、 単純な文字列の検索、 ファイルの復元ができるようになりました。。

links / Burrows-Wheeler Transform に論文を追加しました。

| | コメント (0) | トラックバック (0)

CSA - その2

Wavelet Tree を使った CSA を実装してみる。 .tar.bz2

ううむ、、 定数時間の select アルゴリズムは使ってないので、 PSI function よりも LF mapping の方が高速みたいですねえ。

| | コメント (0) | トラックバック (0)

Compressed Suffix Array

CSA を実装中・・ 今はこんな感じで、 Sadakaneさんのアルゴリズムを使ってます。 Wavelet Tree や rank / select を使った CSA も そのうち実装してみようかな。

| | コメント (0) | トラックバック (0)

« 2005年1月 | トップページ | 2005年3月 »