コンテンツにスキップ

一般句読点 (Unicodeのブロック)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
General Punctuation
範囲 U+2000..U+206F
(112 個の符号位置)
基本多言語面
用字 Common (109 char.)
Inherited (2 char.)
記号集合 Punctuation
Spaces
Format controls
割当済 111 個の符号位置
未使用 1 個の保留
6 個の非推奨 (en)
Unicodeのバージョン履歴
1.0.0 67 (+67)
1.1 76 (+9)
3.0 83 (+7)
3.2 95 (+12)
4.0 97 (+2)
4.1 106 (+9)
5.1 107 (+1)
6.3 111 (+4)
公式ページ
コード表 ∣ ウェブページ
備考: [1] [2]
テンプレートを表示

一般句読点(いっぱんくとうてん、英語: General Punctuation)は、Unicodeの73個目のブロック

解説

[編集]

文書を記述する上で必要な書式制御文字句読点込物が含まれる。幾つかの種類の空白や結合文字方向決定子勾玉引用符英語版 [註 1]感嘆修辞疑問符(‽) などの記事や小説で用いられる句読点、不可視の数学用文字などが含まれる。

その他のここに収録されていない句読点は 補助句読点 (Unicodeのブロック)英語版 と他の多くのブロックに散在している。

収録文字

[編集]
コード 文字 文字名(英語) 用例・説明
スペース
U+2000 EN QUAD ENスペースよりも厳密にen幅を持ったスペース。印刷業界などにおける厳密なレイアウト設計のために用いられ、一般的な文書では用いられない。
U+2001 EM QUAD EMスペースよりも厳密にem幅を持ったスペース。印刷業界などにおける厳密なレイアウト設計のために用いられ、一般的な文書では用いられない。
U+2002 EN SPACE ENスペース。ラテン文字n」の幅を持つスペースに由来する。

EMスペースの半分の幅を持つ[3]

"nut"とも呼ばれる[3]

U+2003 EM SPACE EMスペース。ラテン文字「m」の幅を持つスペースに由来する。

名目上は、ポイント単位の文字サイズと同じスペースを指す[3]

フォントの圧縮係数によって拡大縮小される可能性がある[3]

"mutton"とも呼ばれる[3]

U+2004 THREE-PER-EM SPACE EMスペースの3分の1の幅を持つスペース。

"thick space(太いスペース)"とも呼ばれる[3]

U+2005 FOUR-PER-EM SPACE EMスペースの4分の1の幅を持つスペース。

"mid space(中幅スペース)"とも呼ばれる[3]

U+2006 SIX-PER-EM SPACE EMスペースの6分の1の幅を持つスペース。

コンピュータタイポグラフィでは、「細いスペース(thin space)」に相当することもある[3]

U+2007 FIGURE SPACE フォントのタブ文字と同じ幅のスペース[3]

固定幅の数字を持つフォントの数字の幅に相当する[3]

U+2008 PUNCTUATION SPACE フォントの狭い句読点("." "," "!"など)と同じ幅を持つスペース[3]
U+2009 THIN SPACE EMスペースの5分の1の幅(または6分の1の場合もある)[3]
U+200A HAIR SPACE thin spaceよりも更に幅の狭いスペース。

伝統的なタイポグラフィでは、利用できる最も細いスペースである[3]

制御文字
U+200B ZERO WIDTH SPACE ゼロ幅スペース。一般的にZWSPと略される[3]

スペースの無い文字列で用いられ、不可視な単語の区切りと改行を許可する箇所を明示することを目的としている。幅はないが、2つの文字の間にあっても、両端揃えで文字間隔が広がるのを妨ぐことはできない[3]

U+200C ZERO WIDTH NON-JOINER ゼロ幅非接合子。一般的にZWNJと略される[3]

ブラーフミー系文字など文字列の並びによって特殊な合字を形成する文字において、合字を形成しない元の形をそのまま表示するために用いられる。

U+200D ZERO WIDTH JOINER ゼロ幅接合子。一般的にZWJと略される[3]

絵文字の制御文字など、通常は他の文字と並べても合字とならない文字を合字として表示するために用いられる。

U+200E LEFT-TO-RIGHT MARK 左横書き符号。一般的にLRMと略される[3]

アラビア語などの右横書き言語の中で通常の欧文が記される場合など、部分的に左横書きの規則を適用したい場合に用いられる。

主に句読点の制御に用いられ、右横書き言語で書かれたWEBページなどでは、文末の"."などが自動的に文章の最も左側に配置されてしまうため、欧文の句読点位置が崩れることがある。これを防ぐためにこの制御文字が句読点の後ろに置かれる。

U+200F RIGHT-TO-LEFT MARK 右横書き符号。一般的にRLMと略される[3]

LRMとは逆に欧文の文書内に部分的にアラビア語などの右横書き言語が含まれている場合に用いられ、句読点の位置などが崩れるのを防ぐために用いられる。

ダッシュ
U+2010 HYPHEN ハイフン

複合語の区切りに用いられる。

ASCIIに含まれるハイフンマイナス(U+002D -)とは異なり、ハイフンとしての機能のみを持ち、減算記号としての機能は持たない。

U+2011 NON-BREAKING HYPHEN 改行を許可しないハイフン。通常ハイフン類はその位置で改行を許可するが、この記号の直後では改行を許可しない。
U+2012 FIGURE DASH 数字用ダッシュ。
U+2013 EN DASH ENダッシュ。ラテン文字"n"と同じ幅を持つダッシュ。

数値と数値の間に置かれて、範囲を表す。

"New York–London 便"のように単語同士の間に用いられ、並列的に複合語を形成することもある。

U+2014 EM DASH EMダッシュ。ラテン文字"m"と同じ幅を持つダッシュ。

…(3点リーダ)のように省略や大きな休止を表す。

括弧内のテキストを更に補完するためにペアで使用されることがある[3]

U+2015 HORIZONTAL BAR 文章の前に置かれて引用を表す[3]
一般句読点
U+2016 DOUBLE VERTICAL LINE 数学線形代数学においてペアで用いられ、幾何学的ベクトルノルム(n次元距離)を表す[3]
U+2017 DOUBLE LOW LINE
引用符及びアポストロフィ
U+2018 LEFT SINGLE QUOTATION MARK 単一引用符。

単一引用符はアメリカ英語をはじめとしたほとんどの言語では引用符内で更に引用する場合に用いるが、イギリス英語では単に引用符として用いられる。

英語などでは引用符の開始側として、ドイツ語デンマーク語などではU+201A ‚ SINGLE LOW-9 QUOTATION MARKと共に引用符の終端側として用いられる。

U+2019 RIGHT SINGLE QUOTATION MARK 通常欧文のアポストロフィにはこの文字を使うことが推奨されている[3]

英語などではU+2018 ‘ LEFT SINGLE QUOTATION MARKと共に、オランダ語ポーランド語などではU+201A ‚ SINGLE LOW-9 QUOTATION MARKと共に引用符の終端側として用いられる。

U+201A SINGLE LOW-9 QUOTATION MARK ドイツ語、デンマーク語、オランダ語、ポーランド語などで単一引用符の開始側として用いられる。
U+201B SINGLE HIGH-REVERSED-9 QUOTATION MARK U+2018 ‘と意味上(semantic)は同じ文字だが、見た目が異なる[3]
U+201C LEFT DOUBLE QUOTATION MARK 二重引用符。

二重引用符はアメリカ英語をはじめとした多くの言語では単に引用符として、イギリス英語では引用符内に更に引用がある場合に用いられる。

U+201D RIGHT DOUBLE QUOTATION MARK
U+201E DOUBLE LOW-9 QUOTATION MARK
U+201F DOUBLE HIGH-REVERSED-9 QUOTATION MARK U+201C “と意味上(semantic)は同じ文字だが、見た目が異なる[3]
一般句読点
U+2020 DAGGER 短剣符(ダガー)

註釈を表すための記号として用いられる。

U+2021 DOUBLE DAGGER 二重短剣符

註釈が2箇所ある場合に2番目のものに用いられる。

U+2022 BULLET ブレット

番号なしリストなどで要素を列挙するために用いられる。

U+2023 TRIANGULAR BULLET 三角ブレット。

ブレットと同じ機能を持つ。

U+2024 ONE DOT LEADER 1点リーダ。
U+2025 TWO DOT LEADER 2点リーダ。
U+2026 HORIZONTAL ELLIPSIS 3点リーダ

これらのリーダー符号は省略や長い休止を表す。

U+2027 HYPHENATION POINT 辞書などで"dic·tion·ar·ies"のように単語を区切る正しい位置を示すために使用される目に見える記号[3]
分離子
U+2028 LINE SEPARATOR 行分離子。

行が分かれていることを明示するために用いられる制御文字。改行が段落の分割ではなく単なる行の分割であることを明示するために用いられる。

U+2029 PARAGRAPH SEPARATOR 段落分離子。

段落が分かれていることを明示するために用いられる制御文字。

制御文字
U+202A LEFT-TO-RIGHT EMBEDDING 左横書き埋め込み。一般的にLREと略される[3]

Unicode上で書字方向が定義されていない文字列について、この文字が置かれた箇所からPDFのある位置まで強制的に全ての文章を左横書きとして表示する。但し、Unicode上で書字方向が定義されている場合はUnicodeの双方向アルゴリズムが優先される。

U+202B RIGHT-TO-LEFT EMBEDDING 右横書き埋め込み。一般的にRLEと略される[3]

Unicode上で書字方向が定義されていない文字列について、この文字が置かれた箇所からPDFのある位置まで強制的に全ての文章を右横書きとして表示する。但し、Unicode上で書字方向が定義されている場合はUnicodeの双方向アルゴリズムが優先される。

U+202C POP DIRECTIONAL FORMATTING POP方向フォーマット。一般的にPDFと略される[3]

文字の上書き区間を終了させるために用いられる。

U+202D LEFT-TO-RIGHT OVERRIDE 左横書き上書き。一般的にLROと略される[3]

この文字が置かれた箇所からPDFのある位置まで強制的に全ての文章を左横書きとして表示する。Unicodeの双方向アルゴリズムは無視される。

U+202E RIGHT-TO-LEFT OVERRIDE 右横書き上書き。一般的にRLOと略される[3]

この文字が置かれた箇所からPDFのある位置まで強制的に全ての文章を右横書きとして表示する。Unicodeの双方向アルゴリズムは無視される。

スペース
U+202F NARROW NO-BREAK SPACE 一般的にNNBSPと略される[3]

ノーブレークスペースの狭い形式。通常はthin space(5-5–6/em)またはmid space(4/em)の幅を持つ[3]。 この位置で改行を許可しないことを表す。

一般句読点
U+2030 PER MILLE SIGN 千分率記号(パーミル)。

血中アルコール・塩分濃度の測定[3]や、土木建築業における勾配の表示などに用いられる。

U+2031 PER TEN THOUSAND SIGN 万分率記号(パーミリアド)。

パーセントのパーセント、めったに使用されない[3]

金融分野で金利の変動などを表すために用いられることがある。

U+2032 PRIME プライム記号

時間の単位のや、角度の単位のヤード・ポンド法における長さの単位のフィートを表すために用いられる。

数学や物理学では変数の別バージョンであることを表す。また、解析学においては微分によって得られた1階の導関数であることを表す。

音楽における音名表記では1オクターブ上の音を表す。

U+2033 DOUBLE PRIME 時間の単位のや、角度の単位の、ヤード・ポンド法における長さの単位のインチを表すために用いられる。

解析学においては微分によって得られた2階の導関数であることを表す。

音楽における音名表記では2オクターブ上の音を表す。

U+2034 TRIPLE PRIME 1824年までイギリスで用いられていたヤード・ポンド法における長さの単位のライン(1/12インチ)を表す[3]

解析学においては微分によって得られた3階の導関数であることを表す。

音楽における音名表記では3オクターブ上の音を表す。

U+2035 REVERSED PRIME
U+2036 REVERSED DOUBLE PRIME
U+2037 REVERSED TRIPLE PRIME
U+2038 CARET キャレット

校正において脱字があることを表す校正記号

引用符
U+2039 SINGLE LEFT-POINTING ANGLE QUOTATION MARK 単一山形引用符。単一ギュメ

フランス語、ポーランド語、ロシア語などでは引用符の開始側として、デンマーク語の新聞や、まれにドイツ語では引用符の終端側として用いられる。 単一山形引用符は引用符の中で更に引用がある場合に用いられる。

U+203A SINGLE RIGHT-POINTING ANGLE QUOTATION MARK 単一山形引用符。単一ギュメ。

フランス語、ポーランド語、ロシア語などでは引用符の終端側として、デンマーク語の新聞や、まれにドイツ語では引用符の開始側として用いられる。

一般句読点
U+203B REFERENCE MARK 米印。

日本語において註釈を表すために用いられる。

また、欧州では製本において製本者がページを正しい順序で並び替えられるようにするための記号の一つとして用いられた。

縦書き文書用二重句読点
U+203C DOUBLE EXCLAMATION MARK 二重感嘆符。

日本語や中国語などにおける新聞などの縦書き文書において2つの感嘆符(!!)を1つの文字として表示する場合に用いられる。

チェス代数式記譜法英語版では「素晴らしい、そしてたいていは驚くような行動」を表す。

絵文字形式が提供されている。

一般句読点
U+203D INTERROBANG インテロバング

感嘆符"!"と疑問符"?"を重ねて書いたもの。同時に疑問と感嘆の2つの意味を持つ。

1962年にアメリカ人のマーチン・K・スペクターオランダ語版が考案した記号。

U+203E OVERLINE オーバーライン
U+203F UNDERTIE 古い校正記号で、不用なスペースがあり単語が誤って分割されてしまっていることを表す。現在はU+2050 ⁐ CLOSE UPが主に使われている。

ギリシャ文字におけるenotikonとして用いられる[3]

ウラル音声記号英語版(UPA)では韻律を表す。

U+2040 CHARACTER TIE Z言語において配列の連結を表す。
U+2041 CARET INSERTION POINT キャレット。

校正において脱字があることを表す校正記号[3]

U+2038 ‸ CARETの異体字。

U+2042 ASTERISM アステリズム

註釈記号としてのアスタリスク(U+002A *)を補助するために用いられる。短剣符(U+2020 † DAGGER)を用いた場合の二重短剣符(U+2021 ‡ DOUBLE DAGGER)に相当する。

U+2043 HYPHEN BULLET ハイフン形のブレット。

通常のブレットと同じように列挙に用いられる。

U+2044 FRACTION SLASH 分数スラッシュ

"1⁄32"のように任意の分数を構成するために用いられる[3]

括弧
U+2045 LEFT SQUARE BRACKET WITH QUILL
U+2046 RIGHT SQUARE BRACKET WITH QUILL
縦書き文書用二重句読点
U+2047 DOUBLE QUESTION MARK 二重疑問符。

日本語や中国語などにおける新聞などの縦書き文書において2つの疑問符(??)を1つの文字として表示する場合に用いられる。

チェスの代数式記譜法では致命的なミスを表す。

U+2048 QUESTION EXCLAMATION MARK 疑問符感嘆符。

日本語や中国語などにおける新聞などの縦書き文書において2つの感嘆符(?!)を1つの文字として表示する場合に用いられる。

チェスの代数式記譜法では簡単には反論できない怪しい動きを表す。

U+2049 EXCLAMATION QUESTION MARK 感嘆符疑問符。

日本語や中国語などにおける新聞などの縦書き文書において2つの感嘆符(!?)を1つの文字として表示する場合に用いられる。

チェスの代数式記譜法ではベストとは言えないかもしれないが、興味深い動きを表す。

絵文字形式が提供されている。

一般句読点
U+204A TIRONIAN SIGN ET アイルランド語ゲール文字表記や古英語においてアンパサンド(&)として用いられていた。
U+204B REVERSED PILCROW SIGN 欧州では製本において製本者がページを正しい順序で並び替えられるようにするための記号の一つとして用いられた[4]
U+204C BLACK LEFTWARDS BULLET
U+204D BLACK RIGHTWARDS BULLET
U+204E LOW ASTERISK
U+204F REVERSED SEMICOLON シンド語アラビア文字で書かれているときに時々使用される[3]
U+2050 CLOSE UP 校正記号で、不用なスペースがあり単語が誤って分割されてしまっていることを表す。
U+2051 TWO ASTERISKS ALIGNED VERTICALLY ダブルアステ

日本語では註釈が3つある場合、一つ目にアスタリスク(U+002A *)を、二つ目にダブルアステを用い、三つ目にアステリズム(U+2042 ⁂)を用いることがある。

U+2052 COMMERCIAL MINUS SIGN 商業減算記号。

ドイツや、スウェーデンなどのスカンジナビア諸国において一部の商業文書や金融文書で赤字や負債など、負の数や減算を表すために用いられた。

ドイツ語では"Abzüglich"、スウェーデン語では"med avdrag av"或いは"piska(鞭)"と呼ばれる[3]

書体によっては./.のような形で書かれることもある[3]

正しさを示す装飾記号としても使用される[3]

UPAで、異なる音を持つ関連する借用語を示すために使用される[3]

U+2053 SWUNG DASH UPAや辞書において二つの単語が語源的、或いは音韻学的に関係があることを表す[5]

日本語において区間や範囲を表すために用いられるU+301C 〜 WAVE DASH波ダッシュ)とは別字である。

U+2054 INVERTED UNDERTIE UPAでは韻律を表す。

U+203F ‿ UNDERTIEの異体字。

U+2055 FLOWER PUNCTUATION MARK シロティ・ナグリ文字ベンガル文字、その他のインド文字の句読点として使用される[3]
古典的な句読点
U+2056 THREE DOT PUNCTUATION
一般句読点
U+2057 QUADRUPLE PRIME 音楽における音名表記で4オクターブ上の音を表す。

解析学においては微分によって得られた4階の導関数であることを表す。

古典的な句読点
U+2058 FOUR DOT PUNCTUATION
U+2059 FIVE DOT PUNCTUATION 古代教会スラヴ語において句点として用いられる。
U+205A TWO DOT PUNCTUATION 歴史的には文の終わりや話者が変わったことを示すために用いられていた[3]

文字のベースラインから大文字の高さまで伸びている[3]

U+205B FOUR DOT MARK 余白に強調として記述するために用いる[3]

文字の垂直位置の中央に配置されるが、文字の上端と下端を超えて広がっている[3]

U+205C DOTTED CROSS 余白に強調として記述するために用いる[3]
U+205D TRICOLON
U+205E VERTICAL FOUR DOTS 辞書において文法的には正しいが望ましくない単語の区切りを示すために用いられる[3]

グリフは行の高さ全体に広がる[3]

スペース
U+205F MEDIUM MATHEMATICAL SPACE 数学用中幅スペース。

MMSPと略される[3]

EMスペースの4/18の幅を持つ[3]

制御文字
U+2060 WORD JOINER 単語結合子

一般的にWJと略される[3]

幅を持たず、改行を許可しないスペース(ゼロ幅ノーブレークスペース)[3]。日本語などの分かち書きをしない言語において改行を許可しない箇所であることを明示するために用いる。

この文字はU+FEFF zero width no-break space(ZWNBSP)として定義されているバイト順マークの機能の曖昧さを解消するためのものである[3]。ZWNBSPは元々ゼロ幅ノーブレークスペースのための文字であったが、ファイルがUnicodeでエンコードされていることを示すバイト順マークとしての機能も兼ねていたため、ゼロ幅ノーブレークスペース専用の文字として定義された。

不可視の演算子
U+2061 FUNCTION APPLICATION 関数の適用を示す連続演算子[3]。計算機においてsinxなどでsinが関数であり、後続する文字が変数や数値であることを表すために用いられる。
U+2062 INVISIBLE TIMES 乗算を表す連続演算子[3]。数学において変数を表す記号を連続して書くと乗算を表すが、数式を計算機上で処理する際に連続した文字が変数の乗算を表していることを明示するために用いられる。
U+2063 INVISIBLE SEPARATOR リストを形成する数学記号。例えば、複数のインデックスの間に目に見えるコンマが使用されていない場合に用いられる[3]

数学において上付き文字に複数のインデックスがある場合、インデックス同士の間のコンマを省略することがあり、これを暗黙の乗法と区別するために用いられる[6]

U+2064 INVISIBLE PLUS 加算を示す連続演算子[3]帯分数では整数とその右隣に書かれる分数との間で事実上加算演算子が存在するため、これを計算機上で処理するために用いられる[7]
制御文字
U+2066 LEFT-TO-RIGHT ISOLATE 左横書き独立。一般的にLRIと略される[3]。この文字がある場所からPDIのある文字の位置までの文章を左横書きとして表示するが、Unicodeの双方向アルゴリズムが優先される。LREと似ているが、LREとは異なりこの機能が使われた区間が外部の文字列に影響を与えることはない。

双方向テキストを参照。

U+2067 RIGHT-TO-LEFT ISOLATE 右横書き独立。一般的にRLIと略される[3]。この文字がある場所からPDIのある文字の位置までの文章を右横書きとして表示するが、Unicodeの双方向アルゴリズムが優先される。RLEと似ているが、RLEとは異なりこの機能が使われた区間が外部の文字列に影響を与えることはない。
U+2068 FIRST STRONG ISOLATE 一般的にFSIと略される[3]。この文字がある場所からPDIのある文字の位置までの文章を、FSIの直後にある最初の書字方向が定義された文字の書字方向に統一する。この機能が使われた区間が外部の文字列に影響を与えることはない。
U+2069 POP DIRECTIONAL ISOLATE 一般的にPDIと略される[3]。LRI、RLI、FSIの機能の終端を表す制御文字。
非推奨文字
U+206A INHIBIT SYMMETRIC SWAPPING 対称スワップの禁止。括弧などの記号について、双方向テキストにおいて右横書き言語などでは開始と終了の括弧が逆になるためグリフを入れ替えるが、この機能を停止するために用いられていた。現在はテキストエンジン側で自動で処理されるため使用されていない。
U+206B ACTIVATE SYMMETRIC SWAPPING U+206Aの効果を解除する。
U+206C INHIBIT ARABIC FORM SHAPING アラビア文字の語頭・語中・語末における変化を禁止するために用いられていた。
U+206D ACTIVATE ARABIC FORM SHAPING U+206Cの効果を解除する。
U+206E NATIONAL DIGIT SHAPES 元々通常の算用数字を特定の言語用のものに切り替えるために用いられていた。
U+206F NOMINAL DIGIT SHAPES U+206Eの効果を解除する。

小分類

[編集]

このブロックの小分類は「スペース」(Spaces)、「制御文字」(Format characters)、「ダッシュ」(Dashes)、「一般句読点」(General punctuation)、「引用符及びアポストロフィ」(Quotation marks and apostrophe)、「分離子」(Separators)、「引用符」(Quotation marks)、「縦書き文書用二重句読点」(Double punctuation for vertical text)、「括弧」(Brackets)、「古典的な句読点」(Archaic punctuation)、「不可視の演算子」(Invisible operators)、「非推奨文字」(Deprecated)の12個となっている[3]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。

スペース(Spaces

[編集]

この小分類には様々な幅の空白文字(スペース)が収録されている。

制御文字(Format characters

[編集]

この小分類には書字方向などを制御するための制御文字が収録されている。

ダッシュ(Dashes

[編集]

この小分類にはダッシュなどの横線で表される約物類が収録されている。

一般句読点(General punctuation

[編集]

この小分類には様々な約物が収録されている。

引用符及びアポストロフィ(Quotation marks and apostrophe

[編集]

この小分類にはコンマの形をした引用符(勾玉引用符英語版)が収録されている。

引用符の使い方は言語によって異なるため、文字名はすべての言語の実際の使用法を反映できるわけではない[3]

分離子(Separators

[編集]

この小分類には行や段落が分かれていることをデータとして保存するための制御文字が収録されている。

引用符(Quotation marks

[編集]

この小分類には山形の引用符(ギュメ)が収録されている。

縦書き文書用二重句読点(Double punctuation for vertical text

[編集]

この小分類には日本語や中国語の新聞などの縦書き文書において1文字のサイズで書かれる2つの約物が合体した文字が収録されている。

括弧(Brackets

[編集]

この小分類には括弧類が収録されている。

古典的な句読点(Archaic punctuation

[編集]

この小分類には古典的な文書において用いられていた句読点類が収録されている。

2E2A-2E2D の範囲の複数のドットを含む歴史的な句読点も参照すること[3]

不可視の演算子(Invisible operators

[編集]

この小分類には計算機において数式を処理するために用いられるグリフを持たない制御文字が収録されている。

非推奨文字(Deprecated

[編集]

これらの文字の使用は強く非推奨である[3]

文字コード

[編集]
一般句読点[1][2][3]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+200x NQ
 SP 
MQ
 SP 
EN
 SP 
EM
 SP 
 3/M 
SP
 4/M 
SP
 6/M 
SP
F
 SP 
P
 SP 
TH
 SP 
H
 SP 
ZW
 SP 
ZW
 NJ 
 ZW 
J
 LRM   RLM 
U+201x  NB 
U+202x L
 SEP 
P
 SEP 
 LRE   RLE   PDF   LRO   RLO   NNB 
SP
U+203x
U+204x
U+205x MM
  SP  
U+206x  WJ   ƒ()    ×     ,     +    LRI   RLI   FSI   PDI  I
 SS 
A
 SS 
I
 AFS 
A
 AFS 
NA
 DS 
NO
 DS 
注釈
1.^ Unicode 10.0 より
2.^ 網掛けは非割り当て領域を表わす
3.^U+206A U+206F Unicode 3.0 非推奨

絵文字

[編集]

一般句読点ブロックの二文字 U+203C U+2049 には絵文字が提供されている [8] [9]

絵文字形式 (U+FE0F VS16) 若しくはテキスト形式 (U+FE0E VS15) の累計4種の異字体選択子が提供されている。両文字とも既定ではテキスト形式である [10]

絵文字選択に係る制御綴り
U+ 203C 2049
既定の符号位置
VS15添加 (テキスト形式) ‼︎ ⁉︎
VS16添加 (絵文字形式) ‼️ ⁉️

履歴

[編集]

次の Unicode 関連の文書は、一般句読点ブロックそれぞれの文字を定義する目的・収録状況を記録している:

バージョン Final code points[a] 追加文字数 L2 ID WG2 ID 文書
1.0.0 U+2000..202E, 2030..203E, 2040..2044 67 (to be determined)
L2/11-438[b][c] N4182 Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429) 
1.1 U+203F, 2045..2046, 206A..206F 9 (to be determined)
3.0 U+202F, 2048..2049 3 L2/98-088 N1711 The Working Meeting on Mongolian Encoding Attended by Representatives of China and Mongolia, (1998-02-15) 
L2/98-104 N1734 Whistler, Ken (1998-03-20), Comments on the Mongolian Encoding Proposal, WG2 N1711 
L2/98-252 N1833 Moore, Richard (1998-05-04), Feedback on Ken Whistler's Comments on Mongolian Encoding: N 1734 
L2/98-251 N1808 Reply to "Proposal WG2 N1734" Raised at the Seattle Meeting Regarding "Proposal WG 2 N1711", (1998-07-09) 
L2/98-389R Aliprand, Joan, Consent docket re WG2 Resolutions at its Meeting #35 
L2/99-075.1 N1973 Irish Comments on SC 2 N 3208, (1999-01-19) 
L2/99-075 N1972 Summary of Voting on SC 2 N 3208, PDAM ballot on WD for ISO/IEC 10646-1/Amd. 29: Mongolian, (1999-02-12) 
L2/99-113 Text for FPDAM ballot of ISO/IEC 10646, Amd. 29 - Mongolian, (1999-04-06) 
L2/99-304 N2126 Paterson, Bruce (1999-10-01), Revised Text for FDAM ballot of ISO/IEC 10646-1/FDAM 29, AMENDMENT 29: Mongolian 
L2/99-381 Final text for ISO/IEC 10646-1, FDAM 29 -- Mongolian, (1999-12-07) 
L2/07-209 Whistler, Ken (2007-07-05), UTR 14 and U+202F NARROW NO-BREAK SPACE 
L2/07-225 Moore, Lisa (2007-08-21), UTC #112 Minutes 
L2/11-438[b][c] N4182 Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429) 
L2/15-187 Moore, Lisa (2015-08-11), UTC #144 Minutes 
L2/16-258 Eck, Greg (2016-09-19), Mongolian Base Forms, Positional Forms, & Variant Forms 
L2/16-259 N4753 Eck, Greg; Rileke, Orlog Ou (2016-09-20), WG2 #65 Mongolian Discussion Points 
L2/16-266 Anderson, Deborah; Whistler, Ken; McGowan, Rick; Pournader, Roozbeh; Glass, Andrew; Iancu, Laurențiu; Moore, Lisa (2016-09-26), Comments on Mongolian, Small Khitan, and other WG2 #65 documents 
L2/16-297 N4769 Anderson, Deborah (2016-10-27), Mongolian ad hoc report 
U+204A..204D 4 (to be determined)
3.2 U+2047, 2051 2 L2/99-238 Consolidated document containing 6 Japanese proposals, (1999-07-15) 
N2092 Addition of forty eight characters, (1999-09-13) 
L2/99-365 Moore, Lisa (1999-11-23), Comments on JCS Proposals 
L2/00-024 Shibano, Kohji (2000-01-31), JCS proposal revised 
L2/99-260R Moore, Lisa (2000-02-07), Minutes of the UTC/L2 meeting in Mission Viejo, October 26-28, 1999 
L2/00-098 N2195 Rationale for non-Kanji characters proposed by JCS committee, (2000-03-15) 
L2/00-119[d] N2191R Whistler, Ken; Freytag, Asmus (2000-04-19), Encoding Additional Mathematical Symbols in Unicode 
L2/00-297 N2257 Sato, T. K. (2000-09-04), JIS X 0213 symbols part-1 
L2/00-342 N2278 Sato, T. K.; Everson, Michael; Whistler, Ken; Freytag, Asmus (2000-09-20), Ad hoc Report on Japan feedback N2257 and N2258 
U+204E..2050, 2057, 205F..2062 8 L2/00-119[d] N2191R Whistler, Ken; Freytag, Asmus (2000-04-19), Encoding Additional Mathematical Symbols in Unicode 
U+2052, 2063 2 L2/01-142[d] N2336 Beeton, Barbara; Freytag, Asmus; Ion, Patrick (2001-04-02), Additional Mathematical Symbols 
L2/01-156 N2356 Freytag, Asmus (2001-04-03), Additional Mathematical Characters (Draft 10) 
L2/01-344 N2353 Umamaheswaran, V. S. (2001-09-09), Minutes from SC2/WG2 meeting #40 -- Mountain View, April 2001 
4.0 U+2053..2054 2 L2/02-141 N2419 Everson, Michael (2002-03-20), Uralic Phonetic Alphabet characters for the UCS 
L2/02-192 Everson, Michael (2002-05-02), Everson's Reply on UPA 
N2442 Everson, Michael; Kolehmainen, Erkki I.; Ruppel, Klaas; Trosterud, Trond (2002-05-21), Justification for placing the Uralic Phonetic Alphabet in the BMP 
L2/02-291 Whistler, Ken (2002-05-31), WG2 report from Dublin 
L2/02-292 Whistler, Ken (2002-06-03), Early look at WG2 consent docket 
L2/02-166R2 Moore, Lisa (2002-08-09), UTC #91 Minutes 
L2/02-253 Moore, Lisa (2002-10-21), UTC #92 Minutes 
4.1 U+2055 1 L2/03-151R Constable, Peter; Lloyd-Williams, James; Lloyd-Williams, Sue; Chowdhury, Shamsul Islam; Ali, Asaddar; Sadique, Mohammed; Chowdhury, Matiar Rahman (2003-05-10), Revised Proposal for Encoding Syloti Nagri Script in the BMP 
L2/03-136 Moore, Lisa (2003-08-18), UTC #95 Minutes 
U+2056, 2058..2059 3 L2/03-282R N2610R Everson, Michael; Cleminson, Ralph (2003-09-04), Final proposal for encoding the Glagolitic script in the UCS 
L2/03-324 N2642 Pantelia, Maria (2003-10-06), Proposal to encode additional Greek editorial and punctuation characters in the UCS 
U+205A..205C 3 L2/03-157 Pantelia, Maria (2003-05-19), Additional Beta Code Characters not in Unicode (WIP) 
L2/03-193R N2612-7 Pantelia, Maria (2003-06-11), Proposal to encode additional Punctuation Characters in the UCS 
U+205D 1 L2/02-312R Pantelia, Maria (2002-11-07), Proposal to encode additional Greek editorial and punctuation characters in the UCS 
L2/03-324 N2642 Pantelia, Maria (2003-10-06), Proposal to encode additional Greek editorial and punctuation characters in the UCS 
U+205E 1 L2/03-354 N2655 Freytag, Asmus (2003-10-10), Proposal -- Symbols used in Dictionaries 
L2/03-356R2 Moore, Lisa (2003-10-22), UTC #97 Minutes 
5.1 U+2064 1 L2/07-011R N3198R Freytag, Asmus; Beeton, Barbara; Ion, Patrick; Sargent, Murray; Carlisle, David; Pournader, Roozbeh (2007-01-15), 29 Additional Mathematical and Symbol Characters 
6.3 U+2066..2069 4 L2/12-186R Lanin, Aharon; Davis, Mark; Pournader, Roozbeh (2012-07-24), A Proposal for Bidi Isolates in Unicode 
L2/12-290 N4310 Lanin, Aharon; Davis, Mark; Pournader, Roozbeh (2012-07-31), Proposal for Four Characters for Bidi 
L2/12-239 Moore, Lisa (2012-08-14), UTC #132 Minutes 
L2/13-040 Pournader, Roozbeh; Lanin, Aharon (2013-01-29), Fasttracking Arabic Letter Mark (ALM) 
L2/13-125 N4447 Constable, Peter (2013-06-10), Unicode Liaison Report to WG2 
  1. ^ 提案された符号位置及び文字名称は、最終的なそれらと異なる場合がある
  2. ^ a b L2/10-458 及び L2/11-414L2/11-415L2/11-429 も参照のこと
  3. ^ a b ここにない記号や絵文字の詳細はその他の記号 を参照せよ
  4. ^ a b c ここにない数学記号の詳細はその他の数学記号 (Unicode) を参照せよ

関連項目

[編集]

外部リンク

[編集]

脚注

[編集]

註釈

[編集]
  1. ^ 勾玉引用符 (smart quote) とは、左右 (開き/閉じ) の向きと対応が正しい引用符のこと。

出典

[編集]
  1. ^ Unicode character database”. The Unicode Standard. 2017年11月1日閲覧。
  2. ^ Enumerated Versions of The Unicode Standard”. The Unicode Standard. 2017年11月1日閲覧。
  3. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az ba bb bc bd be bf bg bh bi bj bk bl bm bn bo bp bq "The Unicode Standard, Version 15.1 - U2000.pdf" (PDF). The Unicode Standard (英語). 2024年11月8日閲覧
  4. ^ Michael Everson (1998年5月25日). “Additional signature mark characters for the UCS” (英語). Unicode. 2024年11月13日閲覧。
  5. ^ Michael Everson (2002年4月10日). “Uralic Phonetic Alphabet characters for the UCS” (英語). Unicode. 2024年11月6日閲覧。
  6. ^ Barbara Beeton; Asmus Freytag (2001年4月2日). “Additional Mathematical Symbols (replaces L2/01-088 == SC2/WG2 N2318)” (英語). Unicode. 2024年11月13日閲覧。
  7. ^ Asmus Freytag; Barbara Beeton (2007年1月15日). “29 Additional Mathematical and Symbol Characters (WG2 N3198)” (英語). Unicode. 2024年11月13日閲覧。
  8. ^ UTR #51: Unicode Emoji”. Unicode Consortium (2017年5月18日). 2017年11月1日閲覧。
  9. ^ UCD: Emoji Data for UTR #51”. Unicode Consortium (2017年3月27日). 2017年11月1日閲覧。
  10. ^ UTS #51 Emoji Variation Sequences”. The Unicode Consortium. 2017年11月1日閲覧。