Specials(ATOKでは「特殊用途文字」と訳される)は、UnicodeにおいてU + FFF0 〜 FFFFの基本多言語面の最後に割り当てられる短いブロックである。 これらの16個のコードポイントのうち、5個がUnicode 3.0以降に割り当てられている。 * * U+FFFA interlinear annotation separator 注釈文字の開始 * U+FFFB interlinear annotation terminator 注釈ブロックの終わり * U+FFFC  object replacement character OBJECT REPLACEMENT CHARACTER 複合ドキュメントなど、指定されていない別のオブジェクトのテキスト内を置換する記号OBJECT REPLACEMENT CHARACTER * U+FFFD � replacement character 不明な文字、認識できない文字、表現できない文字を置き換えるために使用される * U+FFFE 非文字 * U+FFFF 非文字

Property Value
dbo:abstract
  • Specials(ATOKでは「特殊用途文字」と訳される)は、UnicodeにおいてU + FFF0 〜 FFFFの基本多言語面の最後に割り当てられる短いブロックである。 これらの16個のコードポイントのうち、5個がUnicode 3.0以降に割り当てられている。 * * U+FFFA interlinear annotation separator 注釈文字の開始 * U+FFFB interlinear annotation terminator 注釈ブロックの終わり * U+FFFC  object replacement character OBJECT REPLACEMENT CHARACTER 複合ドキュメントなど、指定されていない別のオブジェクトのテキスト内を置換する記号OBJECT REPLACEMENT CHARACTER * U+FFFD � replacement character 不明な文字、認識できない文字、表現できない文字を置き換えるために使用される * U+FFFE <noncharacter-FFFE> 非文字 * U+FFFF <noncharacter-FFFF> 非文字 FFFEとFFFFは通常の意味で割り当てられていないが、Unicode文字ではないことが保証されている。これらはテキストの符号化を推測するために使用できる。これらの文字を含むテキストはすべて、正しく符号化されたUnicodeテキストではないとされる。Unicodeの U+FEFF 文字をUnicodeテキストの先頭に挿入してエンディアンを示すことができる。そのようなテキストを読み取り、0xFFFEに遭遇したプログラムは、次のすべての文字の符号の順序を切り替える必要があることを認識する。 �(多くの場合、白い疑問符の付いた黒い菱形または空の四角)は、 Unicode規格のSpecialsにおいてコードポイントU + FFFDに割り当てられている記号であり、システムがデータ内の文字列を正しいシンボルにレンダリングできない場合の問題を示すために使用される。通常はデータが無効であるか、どの文字とも一致しない場合に表示される。 仮に、UTF-8での入力を想定したテキストエディタで、ISO-8859-1エンコード( 0x66 0xFC 0x72 )でドイツ語の単語 "für"を含むテキストファイルを開いたとする。最初と最後のバイトはASCIIにおいて有効なUTF-8エンコードであるが、中間のバイト( 0xFC )はUTF-8で有効なバイトではない。したがって、テキストエディターはこのバイトを置換文字記号に置き換えて、有効なUnicode コードポイントの文字列を生成できる。このときf�rと表示される。さらに、正しく実装されていないテキストエディタにおいては、UTF-8形式に置換して保存される可能性がある。このときテキストファイルのデータは0x66 0xEF 0xBF 0xBD 0x72-8859-1となり、「fï¿1/2r」として表示される(文字化けを参照)。置換はすべてのエラーで同じであるため、元の文字を復元することはできない。 (ja)
  • Specials(ATOKでは「特殊用途文字」と訳される)は、UnicodeにおいてU + FFF0 〜 FFFFの基本多言語面の最後に割り当てられる短いブロックである。 これらの16個のコードポイントのうち、5個がUnicode 3.0以降に割り当てられている。 * * U+FFFA interlinear annotation separator 注釈文字の開始 * U+FFFB interlinear annotation terminator 注釈ブロックの終わり * U+FFFC  object replacement character OBJECT REPLACEMENT CHARACTER 複合ドキュメントなど、指定されていない別のオブジェクトのテキスト内を置換する記号OBJECT REPLACEMENT CHARACTER * U+FFFD � replacement character 不明な文字、認識できない文字、表現できない文字を置き換えるために使用される * U+FFFE <noncharacter-FFFE> 非文字 * U+FFFF <noncharacter-FFFF> 非文字 FFFEとFFFFは通常の意味で割り当てられていないが、Unicode文字ではないことが保証されている。これらはテキストの符号化を推測するために使用できる。これらの文字を含むテキストはすべて、正しく符号化されたUnicodeテキストではないとされる。Unicodeの U+FEFF 文字をUnicodeテキストの先頭に挿入してエンディアンを示すことができる。そのようなテキストを読み取り、0xFFFEに遭遇したプログラムは、次のすべての文字の符号の順序を切り替える必要があることを認識する。 �(多くの場合、白い疑問符の付いた黒い菱形または空の四角)は、 Unicode規格のSpecialsにおいてコードポイントU + FFFDに割り当てられている記号であり、システムがデータ内の文字列を正しいシンボルにレンダリングできない場合の問題を示すために使用される。通常はデータが無効であるか、どの文字とも一致しない場合に表示される。 仮に、UTF-8での入力を想定したテキストエディタで、ISO-8859-1エンコード( 0x66 0xFC 0x72 )でドイツ語の単語 "für"を含むテキストファイルを開いたとする。最初と最後のバイトはASCIIにおいて有効なUTF-8エンコードであるが、中間のバイト( 0xFC )はUTF-8で有効なバイトではない。したがって、テキストエディターはこのバイトを置換文字記号に置き換えて、有効なUnicode コードポイントの文字列を生成できる。このときf�rと表示される。さらに、正しく実装されていないテキストエディタにおいては、UTF-8形式に置換して保存される可能性がある。このときテキストファイルのデータは0x66 0xEF 0xBF 0xBD 0x72-8859-1となり、「fï¿1/2r」として表示される(文字化けを参照)。置換はすべてのエラーで同じであるため、元の文字を復元することはできない。 (ja)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 4153280 (xsd:integer)
dbo:wikiPageLength
  • 12616 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 81163926 (xsd:integer)
dbo:wikiPageWikiLink
prop-ja:_
  • 1 (xsd:integer)
  • 3 (xsd:integer)
prop-ja:blockname
  • Specials (ja)
  • Specials (ja)
prop-ja:group
  • lower-alpha (ja)
  • lower-alpha (ja)
prop-ja:nonchar
  • 2 (xsd:integer)
prop-ja:rangeend
  • FFFF (ja)
  • FFFF (ja)
prop-ja:rangestart
  • FFF0 (ja)
  • FFF0 (ja)
prop-ja:script
  • 共通 (ja)
  • 共通 (ja)
prop-ja:wikiPageUsesTemplate
rdfs:comment
  • Specials(ATOKでは「特殊用途文字」と訳される)は、UnicodeにおいてU + FFF0 〜 FFFFの基本多言語面の最後に割り当てられる短いブロックである。 これらの16個のコードポイントのうち、5個がUnicode 3.0以降に割り当てられている。 * * U+FFFA interlinear annotation separator 注釈文字の開始 * U+FFFB interlinear annotation terminator 注釈ブロックの終わり * U+FFFC  object replacement character OBJECT REPLACEMENT CHARACTER 複合ドキュメントなど、指定されていない別のオブジェクトのテキスト内を置換する記号OBJECT REPLACEMENT CHARACTER * U+FFFD � replacement character 不明な文字、認識できない文字、表現できない文字を置き換えるために使用される * U+FFFE <noncharacter-FFFE> 非文字 * U+FFFF <noncharacter-FFFF> 非文字 (ja)
  • Specials(ATOKでは「特殊用途文字」と訳される)は、UnicodeにおいてU + FFF0 〜 FFFFの基本多言語面の最後に割り当てられる短いブロックである。 これらの16個のコードポイントのうち、5個がUnicode 3.0以降に割り当てられている。 * * U+FFFA interlinear annotation separator 注釈文字の開始 * U+FFFB interlinear annotation terminator 注釈ブロックの終わり * U+FFFC  object replacement character OBJECT REPLACEMENT CHARACTER 複合ドキュメントなど、指定されていない別のオブジェクトのテキスト内を置換する記号OBJECT REPLACEMENT CHARACTER * U+FFFD � replacement character 不明な文字、認識できない文字、表現できない文字を置き換えるために使用される * U+FFFE <noncharacter-FFFE> 非文字 * U+FFFF <noncharacter-FFFF> 非文字 (ja)
rdfs:label
  • Specials (Unicode block) (ja)
  • Specials (Unicode block) (ja)
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of