TidyText v0.5

2003年12月1日初版

TidyTextは,ドラッグ・アンド・ドロップ操作で駆動する,テキストファイルを正規化したり調査したりするプログラムです。TidyTextは,MacOS Xで実行します。

TidyTextは,主にMacintoshで作成した各種のXMLデータをWindowsやUNIXへ引き渡す場合に用います。とりわけ,Macにおける大半のエディターはテキストファイルにリソースを付加していますので,そのままWindowsやUNIXへ引き渡すと,リソースがテキストファイルに混入したり,別のファイルが作られたりします。これを解決するのがTidyTextです。今後,文字符号系の変換も行いたいと考えています。

TidyTextは,ドラッグ・アンド・ドロップ操作で放り込まれたテキストファイル(複数)に対して次のような処理を行います。

なお,この処理を施さないファイルの拡張子を指定できます。上記の処理条件は条件設定ファイル“%TidyText%”を用いて行います。

処理対象となるテキストファイルは,ファイルタイプが“TEXT”のものです。テキストファイルに拡張子はあってもなくてもかまいません。なお,フォルダーは処理対象となりません。

処理は変換モードと走査モードに分かれます。通常は変換モードです。走査モードで実行する場合,処理対象となるテキストファイルの内容は変換されません。

条件設定ファイル%TidyText%は,次のような行からなるテキストです。

行の文字列意 味
先頭が“#”から始まる行 単なる注釈です。
EOL=OS名変換モードにおいて「変換結果の行末符号の種類」を指定します。
EOL=MACINTOSHでは,CRが行末符号となります。
EOL=WINDOWSでは,CR-LFが行末符号となります。
EOL=UNIXでは,LFが行末符号となります。
省略時は,EOL=WINDOWSとなります。
注:ここで指定した行末符号が入力したテキストファイルの行末符号と同じであってもかまいません。
ESCAPED-EXTENSION=拡張子 「処理対象としないファイルの拡張子」を指定します。
これは複数通り指定できます。
拡張子は小文字として解釈されます。
注:この指定は,ファイルタイプが曖昧なバイナリーファイルを処理対象から外すためにあります。
例:
ESCAPED-EXTENSION=jpg
ESCAPED-EXTENSION=JPEG
ESCAPED-EXTENSION=png
EXTENSION-CREATOR=4文字のクリエーター, 拡張子 変換モードにおいて「拡張子に対して変換結果として設定するクリエーター」を指定します。
これは複数通り指定できます。
4文字のクリエーターは「そのまま」の文字を指定します。
拡張子は小文字として解釈されます。
省略時は,EXTENSION-CREATOR=ttxt,txtとなります。
注:この指定は,Macintoshでテキストファイルを操作するためのものですが,指定してもリソースは付加されません。
例:
EXTENSION-CREATOR=MSIE,htm
EXTENSION-CREATOR=Kisi,svg
EXTENSION-CREATOR=DSTL,ps
EXTENSION-CREATOR=Kisi,xml
EXTENSION-CREATOR=Kisi,xsl
EXTENSION-CREATOR=Kisi,fo
INFO ファイルごとの行末符号の種類,データの長さ,リソースの有無を次のように表示します。この指定があると,走査モードで実行されます。
ファイルへのパス名
 ファイル名 OS名 データの長さ リソースの有無
ここで,
OS名は,次のように表示します。
 MACINTOSH:すべての行末符号がCRであることを表します。
 WINDOWS:すべての行末符号がCR-LFであることを表します。
 UNIX:すべての行末符号がLFであることを表します。
 ???:ファイル内の行末符号が混在し一定でないことを表します。
データの長さは,データの論理的な長さをバイト単位で表示します。
リソースの有無は,リソースがあれば“RSRC”と表示します

TidyTextは,私(岸 和孝)が開発しました。

TidyTextは,フリーウェアですので,「そのまま」の形であれば自由に頒布してかまいません。自己責任でお使いください。

TidyTextの実行は,次の環境で確認しました。

制約事項:ファイル名に仮名の濁音や半濁音(例えば,“”…のコピー.txt”)が混じっていると,正しく変換できません。

注意事項:MacOS Xでは拡張子が隠されることがありますので,変換処理が期待通りにならないことがあります。そのような場合は,「ファイル」メニューの「情報を見る」で「名前と拡張子」を確認してください。


(c)2003 KISI