string は一連の文字です。PHPでは、文字は1バイトと同じ です。つまり、256個の異なる文字を使用可能です。これは、PHPは、 Unicodeをネーティブにサポートしていないことも意味します。
注意 文字列が非常に大きくなっても問題ありません。PHPに課せられる文字列 のサイズの実用上の制限はありません。このため、長い文字列に関して 恐れる必要は全くありません。
文字列リテラルは、3つの異なる方法で指定することが可能です。
文字列を指定する最も簡単な方法は、引用符(文字 ')で括ることです。
リテラルの引用符指定するには、多くの他の言語と同様にバックスラッ シュ(\)でエスケープする必要があります。 バックスラッシュを引用符の前または文字列の最後に置きたい場合は、 2重にする必要があります。この他の文字をエスケープする場合には、 バックスラッシュも出力されることに注意して下さい! このため、通常、 バックスラッシュ自体をエスケープする必要はありません。
注意 PHP 3では、この場合、E_NOTICEレベルの警告が 出力されます。
注意 他の二つの構文と異なり、引用符で括られた文字列の中にある変数は 展開されません。
echo 'this is a simple string'; echo 'You can also have embedded newlines in strings, like this way.'; echo 'Arnold once said: "I\'ll be back"'; // 出力: ... "I'll be back" echo 'Are you sure you want to delete C:\\*.*?'; // 出力: ... delete C:\*.*? echo 'Are you sure you want to delete C:\*.*?'; // 出力: ... delete C:\*.*? echo 'I am trying to include at this point: \n a newline'; // 出力: ... this point: \n a newline |
文字列が2重引用符(")で括られた場合, PHPはより多くの特殊文字のエ スケープシーケンスを理解します。
表 6-1エスケープされた文字
記述 | 意味 |
---|---|
\n | ラインフィード(LFまたはアスキーの0x0A (10)) |
\r | キャリッジリターン (CRまたはアスキーの0x0D (13)) |
\t | 水平タブ(HTまたはアスキーの0x09 (9)) |
\\ | バックスラッシュ |
\$ | ドル記号 |
\" | 2重引用符 |
\[0-7]{1,3} | 正規表現にマッチする文字シーケンスは、8進数表記の1文字です。 |
\x[0-9A-Fa-f]{1,2} | 正規表現にマッチする文字シーケンスは、16進数表記の1文字です。 |
繰り返しますが、この他の文字をエスケープしようとした場合には、バッ クスラッシュも出力されます!
しかし、二重引用符で括られた文字列で最も重要なのは、変数名が展開 されるところです。詳細は、文字列のパースを 参照下さい。
文字列を区切る別の方法としてヒアドキュメント構文("<<<") があります。この場合、あるIDを<<<の後 に指定し、文字列を置いた後で、同じIDを括りを閉じるために置きます。
終端IDは、その行の最初のカラムから始める必要があります。使用するラ ベルは、PHPの他のラベルと同様の名前に関する規則に従う必要がありま す。つまり、英数字およびアンダースコアのみを含み、数字でない文字ま たはアンダースコアで始まる必要があります。
警告 |
非常に重要なことですが、閉じる側のIDがある行には、セミコロン (;)以外の他の文字が含まれていてはならないこ とに注意して下さい。これは、特にIDはインデントしてはならないと いうことと、セミコロンの前に空白やタブを付けてはいけないことを 意味します。 恐らく、最もやっかいな問題は、行末が復改文字 (\r)でなく、改行(\n)とも 呼ばれるフォームフィードのみであることもあり得ることです。 マイクロソフト Windows は、行末記号としてシーケンス \r\nを使用しています。このため、Windowsのエ ディタでスクリプトを書いている場合には、ヒアドキュメントが動作 しない可能性があります。しかし、多くのプログラム用のエディタは、 ファイルをUNIXの改行文字で保存する機能を有しています。 |
ヒアドキュメントは、2重引用符を使用しませんが、2重引用符で括られた 文字列と全く同様に動作します。しかし、この場合でも上記のリストでエ スケープされたコードを使用することも可能です。変数は展開されますが、 文字列の場合と同様にヒアドキュメントの内部で複雑な変数を表わす場合 には注意が必要です。
注意 ヒアドキュメントはPHP4で追加されました。
スクリプトが2重引用符で括られるかヒアドキュメントで指定された場 合、その中の変数はパースされます。
構文の型には、単純な構文と 複雑な 構文の2種類があります。簡単な構文は、最も一般的で便利です。 この構文では、変数、配列値やオブジェクトのプロパティをパースする ことが可能です。
複雑な構文は、PHP 4で導入されました。 この構文は、式を波括弧で括ることにより認識されます。
ドル記号($)を見付けるとパーサは、有効な変数 名を形成することが可能な最長のトークンを取得します。変数名の終 りを明示的に指定したい場合は、変数名を波括弧で括って下さい。
$beer = 'Heineken'; echo "$beer's taste is great"; // 動作します。"'" は変数名として無効な文字です。 echo "He drunk some $beers"; // 動作しません。's' は、変数名として有効な文字です。 echo "He drunk some ${beer}s"; // 動作します。 |
同様に、配列添字とオブジェクトのプロパティをパースすることも可 能です。配列添字の場合、閉じ角括弧(']')は添字の終りを意味し、 オブジェクトのプロパティの場合、同じ規則が簡単な変数として適用 されます。しかし、オブジェクトプロパティには、変数の場合のよう な手法はありません。
$fruits = array( 'strawberry' => 'red' , 'banana' => 'yellow' ); // シングルクオートの外では動作が異なることに注意してください。 echo "A banana is $fruits[banana]."; echo "This square is $square->width meters broad."; // 動作しません。解決策については、複雑な構文を参照下さい。 echo "This square is $square->width00 centimeters broad."; |
より複雑な場合は、複雑な構文を使用する必要があります。
この構文は、構文が複雑であるからではなく、この方法では複雑な式 を含めることができるため、複雑と呼ばれています。
事実、この構文により文字列の中に名前空間にあるあらゆる値を含め ることが可能です。文字列の外側に置く場合と同様に式を書き、これ を { と } の間に含めて下さい。'{'はエスケープすることができない ため、この構文は $が{のすぐ後に続く場合にのみ認識されます。 (リテラル"{$"を指定するには、"{\$"または"\{$"を使用して下さい) 以下のいくつかの例を見ると理解しやすくなるでしょう。
$great = 'fantastic'; echo "This is { $great}"; // 動作しません。出力は、This is { fantastic} echo "This is {$great}"; // 動作します。出力は、This is fantastic echo "This square is {$square->width}00 centimeters broad."; echo "This works: {$arr[4][3]}"; // $foo[bar]が文字列の外では使用できないのと // 同じ理由で動作せず。 echo "This is wrong: {$arr[foo][3]}"; echo "You should do it this way: {$arr['foo'][3]}"; echo "You can even write {$obj->values[3]->name}"; echo "This is the value of the var named $name: {${$name}}"; |
波括弧の後に任意の文字をゼロから始まるオフセットで指定することに より、文字列内の文字にアクセスすることが可能です。
注意 過去の互換性のため、配列括弧を使用することが可能です。しかし、 この構文はPHP 4に依存しています。
例 6-3複数のstringの例
|
文字列は、'.' (ドット)結合演算子で結合することが可能です。'+'(付 加)演算子はこの例では出てこないことに注意して下さい。詳細について は 文字列演算子 を参照下さい。
文字列の修正を行う場合に便利な関数がたくさんあります。
一般的な関数については、文字列関数の 節 を参照下さい。高度な検索/置換を行う正規表現関数について は、Perl および POSIX 拡張の2種類ありますが、そ れぞれの節を参照下さい。
URL文字列用関数や文字列sの暗号化/ 復号化用関数(mcrypt および mhash)もあります。
最後に、探しているものがまだ見付からない場合には、 文字型の関数も参照下さい。
数値として文字列が評価された時、結果の値と型は次のように 定義されます。
文字列は、'.'、'e'、'E' のどれかが含まれている場合は float、それ以外は整数として評価されます。
文字列の最初の部分により値が決まります。文字列が、有効な数値デー タから始まる場合、この値が使用されます。その他の場合、値は 0 (ゼ ロ) となります。有効な数値データは符号(オプション)の後に、1つ以上 の数字(オプションとして小数点を一つ含む)、オプションとして指数部 が続きます。指数部は 'e' または 'E' の後に一つ以上の数字が続く形 式です。
最初の式が文字列の場合、変数の型は2番目の式に依存します。
$foo = 1 + "10.5"; // $foo は float です (11.5) $foo = 1 + "-1.3e3"; // $foo は float です (-1299) $foo = 1 + "bob-1.3e3"; // $foo は integer です (1) $foo = 1 + "bob3"; // $foo は integer です (1) $foo = 1 + "10 Small Pigs"; // $foo は integer です (11) $foo = 1 + "10 Little Piggies"; // $foo は integer です (11) $foo = "10.0 pigs " + 1; // $foo は integer です (11) $foo = "10.0 pigs " + 1.0; // $foo は float です (11) |
この変換に関する詳細は、UNIXマニュアルstrtod(3) を参照下さい。
本節の例を試したい場合、その例をカットアンドペーストしてから 動作を確認するために次の行を挿入して下さい。