TR(1) | FreeBSD General Commands Manual | TR(1) |
名称
tr — 文字の置換書式
tr | [ -Ccsu] string1 string2 |
tr | [ -Ccu] -d string1 |
tr | [ -Ccu] -s string1 |
tr | [ -Ccu] -ds string1 string2 |
解説
tr ユーティリティは、選択された文字を置き換え、または削除しながら標準入力を標準出力にコピーします。以下のオプションが利用できます:
- -C
-
string1 に含まれる文字の補集合を表します。つまり“
-C
ab
”は、‘a
’と‘b
’を除く全ての文字を含みます。 - -c
- -C と同じですが、 string1 に含まれる値の補集合となります。
- -d
- 入力から、 string1 に含まれる文字を削除します。
- -s
- 最後の引数 ( string1 か string2 のどちらか) に含まれている同一の文字が、入力の中に連続して現れるとき、それを 1 つの文字に圧縮します。この圧縮は、全ての削除や変換が終わった後に行われます。
- -u
- 出力がバッファリングされないことを保証します。
書式の最初の形式では、 string1 に含まれる文字は、 string1 の 1 文字目は、 string2 の 1 文字目と置き換え...というように string2 に置き換えられます。もし string1 が string2 よりも長い場合は、 string2 の最後の文字が、 string1 と対応させるのに足りない分だけ続いているものとみなされます。
書式の 2 番目の形式では、 string1 に含まれる文字は、入力から削除されます。
書式の 3 番目の形式では、 string1 に含まれる文字は、 -s オプションの解説の通りに圧縮されます。
書式の 4 番目の形式では、 string1 に含まれる文字は入力から削除され、 string2 に含まれる文字は、 -s オプションの解説の通りに圧縮されます。
string1, string2 の文字の集合を指定するのに、以下のような記述方法が利用できます:
- character
- 以下で示したものを除く、その文字自身を表す通常の文字 (キャラクタ) です。
- \octal
- バックスラッシュに続き、1〜3 桁の 8 進数が続いたものは、その値を符号化した文字を表現します。この 8 進数の並びに続いて数字を文字として指定したい場合には、8 進数の並びが 3 桁となるように、8 進数の上位桁 (左) に 0 を埋めてください。
- \character
-
バックスラッシュに続く、特定の特殊な文字は、特殊な値に対応しています。
\a <ベル文字> \b <バックスペース> \f <フォームフィード> \n <改行> \r <復帰> \t <水平タブ> \v <垂直タブ> これら以外のバックスラッシュに続く文字は、その文字自身に対応します。
- c-c
-
範囲の両端を非 8 進数で指定すると、文字の範囲を表します。この範囲は、両端を含む、照合順序で定義された昇順のものです。片方もしくは両方の端点が 8 進数シーケンスの場合、コード化された値の範囲を表します。この範囲は、両端を含みます。
現在の実装による範囲式の解釈が、以前の実装と違う事に関する重要な注記は、以下の 互換性 セクションを参照してください。
- [:class:]
-
定義された文字クラスに属する、全ての文字を表します。クラス名は以下の通りです:
alnum <英数字> alpha <英字> blank <空白類文字> cntrl <コントロール文字> digit <数字> graph <グラフィック文字> ideogram <表意文字> lower <英小文字> phonogram <表音文字> print <表示可能文字> punct <句読点> rune <有効な文字> space <空白文字> special <特殊文字> upper <英大文字> xdigit <16 進数> “
[:lower:]
”が string1 に登場し、“[:upper:]
”が string2 で相対的に同じ位置に登場する場合、現在のロケールにおける LC_CTYPE カテゴリでの toupper マッピングの文字列ペアを表現します。“[:upper:]
”が string1 に登場し、“[:lower:]
”が string2 で相対的に同じ位置に登場する場合、現在のロケールにおける LC_CTYPE カテゴリでの tolower マッピングの文字列ペアを表現します。大文字小文字の変換の例外を除けば、クラス内の文字の順序は特定されていません。
どのような ASCII 文字が、これらのクラスに含まれているのかという情報を調べたい場合には、 ctype(3) および関連マニュアルを参照してください。
- [=equiv=]
- equiv と同じ同値関係クラスに属する全ての文字を表します。これらはエンコード値の順序となります。
- [#*n]
- # で指定された n 個の文字の繰り返しを表現します。この表現は、 string2 で指定されたときのみ有効です。もし n が省略された場合、または 0 の場合は、 string2 が string1 の長さを満たすような、十分大きな値として解釈されます。 n は、0 で始まる場合には、 8 進数として、そうでない場合には、10 進数として解釈されます。
終了ステータス
The tr utility exits 0 on success, and >0 if an error occurs.使用例
以下の例は、シェルに対して与えられたものです:file1 に含まれる単語 (文字の最大長の並び) のリストを、各行につき 1 つずつ出力します。
tr -cs "[:alpha:]""\n" < file1
file1 の内容を大文字に変換します。
tr "[:lower:]""[:upper:]" < file1
(これは、すべてのロケールで正しく動作するため、 UNIX の伝統的な慣用句である“ tr a-z A-Z
”よりも好ましいです)
表示できない文字を file1 から削除します。
tr -cd "[:print:]" < file1
発音区分記号を、‘ e
’のアクセント付きバリアントすべてから削除します。
tr "[=e=]""e"
互換性
以前の FreeBSD における tr の実装では、現在のロケールの参照順序に従って範囲式中の文字を順序づけませんでした。このため (英語のテキストのように) アクセントがつけられていない Latin 文字を、 UNIX の伝統的な慣用句である“tr A-Z a-z
”を用いて大文字から小文字へと変換する事ができました。しかし、現在の
tr は、ロケールの参照順序に従うので、大文字と小文字の間に 1:1 のマッピングが存在しない場合や大文字と小文字で文字の順序が異なる場合は、この慣用句は、正しい結果を生成しません。上記の
使用例 セクションに書かれてるように、“
a-z
”と“
A-Z
”のように文字範囲を明示するのではなく、文字クラス式である“
[:lower:]
”と“
[:upper:]
”を使うべきでしょう。
古くからの BSD の実装および POSIX 標準では、文字の範囲指定には、“ c-c
”という文法を用いますが、古い System V の実装では、“ [c-c]
”を用いています。 System V のシェルスクリプトは、文字の置換を行おうとする場合には、うまく動作するはずです。つまり、“ tr [a-z] [A-Z]
”と指定した場合には、 string1 の‘ [
’が string2 の‘ [
’に変換されるため、うまく動作します。しかし、シェルスクリプトが、“ tr -d [a-z]
”, というコマンドのように文字の削除や圧縮を行う場合には、‘ [
’と‘ ]
’の文字が削除や圧縮の対象に含まれてしまいます。古い実装の System V では、このようには動作しません。さらに、‘ a
’, ‘ -
’, ‘ z
’という 3 つの文字を表現するのに、“ a-z
”と記述するような、その並びに依存しているあらゆるスクリプトは、“ a\-z
”と書き直す必要があります。
tr ユーティリティは、昔から、入力における NUL バイトの操作を禁止されていました。さらに、入力から NUL を取り除いていました。この実装では、この振る舞いは、バグとみなされ、削除されました。
tr ユーティリティは、昔から、たとえば、2 つの文字列が指定されない限り -c および -s オプションを無視する、などの文法上の誤りを極端なまでに許していました。この実装では、不正な文法は、許されなくなっているはずです。
規格
tr ユーティリティは、 IEEE Std 1003.1-2001 (“POSIX.1”) に適合しています。“ideogram”, “phonogram”, “rune”と“special”文字クラスは、拡張です。 string2 が string1 よりも短い場合に string2 の最後の文字が複製される機能は、 POSIX では、許されていますが必須ではないことに注意して下さい。他の POSIX システムへの可搬性のあるシェルスクリプトを作ろうとするならば、この振る舞いを当てにせずに、“ [#*]
”という表現を使うべきです。 -u オプションは、 IEEE Std 1003.1-2001 (“POSIX.1”) 標準の拡張です。
October 13, 2006 | FreeBSD |