KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはである。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。 KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。 RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。

Property Value
dbo:abstract
  • KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはである。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、ASCIIのラテン文字と対応する符号位置に疑似ローマ字順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは不自然に見えるかもしれないが、8ビット目が落ちて文字化けしても、大文字小文字を入れ替えた翻字をすることで通常のASCII端末上で文章をまだ読める (もしくは少なくとも解読できる) という役に立つ特性である。たとえば、KOI8-Uの "Русский Текст"(ルスキー・テクスト、ロシア語のテキストの意) は8ビット目を落とすと rUSSKIJ tEKSTになる。その一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。 上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。 KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。 RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。 いくつかの参考文献には誤植があり、文字B4はU+0403であると誤って述べている (正しくはU+0404)。この誤植はRFC 2319のAppendix Aにも存在する (ただしRFC本文の表には正しいマッピングが示されている)。 (ja)
  • KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはである。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、ASCIIのラテン文字と対応する符号位置に疑似ローマ字順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは不自然に見えるかもしれないが、8ビット目が落ちて文字化けしても、大文字小文字を入れ替えた翻字をすることで通常のASCII端末上で文章をまだ読める (もしくは少なくとも解読できる) という役に立つ特性である。たとえば、KOI8-Uの "Русский Текст"(ルスキー・テクスト、ロシア語のテキストの意) は8ビット目を落とすと rUSSKIJ tEKSTになる。その一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。 上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。 KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。 RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。 いくつかの参考文献には誤植があり、文字B4はU+0403であると誤って述べている (正しくはU+0404)。この誤植はRFC 2319のAppendix Aにも存在する (ただしRFC本文の表には正しいマッピングが示されている)。 (ja)
dbo:wikiPageID
  • 1217529 (xsd:integer)
dbo:wikiPageLength
  • 4110 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 87371365 (xsd:integer)
dbo:wikiPageWikiLink
prop-en:wikiPageUsesTemplate
dct:subject
rdfs:comment
  • KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはである。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。 KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。 RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。 (ja)
  • KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはである。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 上記の表において、20は通常の空白 (SPACE) 文字であり、9Aはノーブレークスペース (NO-BREAK SPACE) である。 KOI8-Rとの違いは位置 0xA4; 0xA6; 0xA7; 0xAD; および 0xB4; 0xB6; 0xB7; 0xBD; にある。これらはロシア語に存在しない追加の文字からなる。 RFC 2319では文字95がU+2219 (∙) であるべきだと言っているが、のビュレット文字に合わせるためU+2022 (•) が使われる場合もある。 (ja)
rdfs:label
  • KOI8-U (ja)
  • KOI8-U (ja)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageWikiLink of
is owl:sameAs of
is foaf:primaryTopic of