字句要素とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > 字句要素の意味・解説 

字句

(字句要素 から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/04/03 19:39 UTC 版)

字句(じく)とは、プログラミング言語などにおいてソースコードに出現する文字列の中で意味を持つ最小単位であり、トークン: token)とも言う。

詳細は言語によって異なるが、一般的には、以下のようなトークンがある。

  • ifintなどのキーワード(あるいは予約語
  • mainargc などといった関数(サブルーチン)名や変数名などの識別子
  • { } ( ) [ ] などの括弧類(の片方ずつ)
  • + - * / = > < & | などの演算子[注釈 1]
  • , . : ; などの区切り文字
  • 3.14159"hello" のようなリテラル

括弧類や区切り文字が出現位置によっては演算子となる言語もある。

多くの場合、プログラミング言語の構文規則はトークン列を定義しており[2]構文解析の前に、まずトークンを切り出し、必要であれば種類別に分類したりもする。この処理を字句解析と呼ぶ。この処理のため、プログラミング言語の言語仕様では、それぞれの種類のトークンはどのような文字から構成されるかが規定されている。

(例)識別子は、英字で始まり、その後に0個以上の英字、数字または下線 (_) が続く。ただしキーワード(あるいは予約語)と同じ綴りでないこと。

一般に構文規則はその文脈自由文法が(バッカス・ナウア記法で)示されることが多いのに対し、字句規則は正規表現で示されることが多い。上の例を正規表現で表すと [A-Za-z][0-9A-Z_a-z]* となる。ここで、「キーワード(あるいは予約語)と同じ綴りでないこと」という制限は、この表現には含まれない。プログラミング言語における規則には、一般にそういった制限が多いが、それを正規表現で表現するのは難しい(長大になる)ことも多い。キーワードの規則と識別子の規則はよく似たものであることも多く、いったんキーワードと識別子を同じ規則で処理しておき、その後に出現位置などの文脈に応じて分類し直すほうが効率的でもある。拡張性や後方互換性の観点から、通常は識別子として利用することもできるが、特定の出現位置ではキーワードの役割を果たすような「文脈依存キーワード」(contextual keyword, keyword in context, context-sensitive keyword) をサポートする言語も多い[3][4]

脚注

注釈

  1. ^ ++, --, **, //, ==, >>, <<, &&, ||, ->, => のように連続する2文字でひとつのトークンを形成する場合もある。divmodandorのように、記号だけでなく自然言語の単語に似た英数字の文字列から成る演算子を持つ言語もある。プログラマが独自の文字シーケンスから成る演算子をカスタム定義できる言語もある[1]

出典

関連項目




英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「字句要素」の関連用語

字句要素のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



字句要素のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの字句 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS