第5回
参照ページ
HWB関連ページ 13.4.11



正規表現
正規表現とは?
例えば、 new.txt という名前のファイルがあったとします。
このファイルの内容を見る時、 more new.txt と入力すれば、このファイルの詳細を見ることができます。
ところが、 more n* としても new.txt の内容を見ることができます。この場合は、「nで始まる全てのファイルの内容を表示しろ」という意味のコマンドになります。
つまり、ファイル名全てを指定するのではなく、ファイル名の一部のみを指定し、他の文字を他の記号によって代用することができます。この時に使う表現方法を「正規表現」と呼んでいます。

正規表現は、ファイル名を指定するコマンドであればどれにでも使うことができます。
上の例で言うと、 rm n* で「nで始まる全てのファイルを消去しろ」
ls n* で「nで始まる全てのファイルを表示しろ」ということになります。

*
任意の文字列の代用として使うことができます。上の例のように
more n* で「nで始まる全てのファイルの内容を表示しろ」というような使い方の他に、
more n*x* などとすると、「nで始まり、途中にxを含む全てのファイルの内容を表示しろ」ということになります。
* はその中に何文字あろうと文字列の代用品として機能するからです。

?
任意の一文字の代用として使うことができます。基本的な使い方は * と同じですが、 ? は一文字の代用品としてしか使えません。例えば、
more n? だと、「nで始まり、その後ろに何か一文字がついてる全てのファイルの内容を表示しろ」という意味にしかならず、 new.txt を表示することはできません。

[ ]
任意の一文字の代用として使うことができます。基本的な使い方は * や ? と同じですが、最大の違いは、 [ ] の中に何を入れるかによって意味が変わることです。
例えば [a-c] とすると、 a から c の間の任意の文字の代用品として使われます。

文字コード
本来コンピューターのデータは全て0と1の羅列のみで成り立っています。
それを日本語として表示するための対応表みたいなのが文字コードです。
この文字コードが違うと、コンピューターのデータとしては同じでも文字として全く違うものが表示されてしまったりします。この症状のことを俗に「文字化け」といいます。
直すには、「エンコード」というものを変更する必要があります。
エンコードというのは文字コードの種類。同意語と解釈して良いような悪いような。
ちなみにインターネットエクスプローラーの場合、上の方に出てる「ツール」とうメニューの中から「エンコード」を選べば文字コードを変更できます。
一部の文字コードに変更すると、このページでも文字化けが起こせます。

他のを見る