CharUnicodeInfoとは? わかりやすく解説

CharUnicodeInfo クラス

メモ : このクラスは、.NET Framework version 2.0新しく追加されたものです。

Unicode 文字に関する情報取得します。このクラス継承できません。

名前空間: System.Globalization
アセンブリ: mscorlib (mscorlib.dll 内)
構文構文

Public NotInheritable Class
 CharUnicodeInfo
Dim instance As CharUnicodeInfo
public sealed class CharUnicodeInfo
public ref class CharUnicodeInfo sealed
public final class CharUnicodeInfo
public final class CharUnicodeInfo
解説解説

Unicode 標準では、Unicode 文字いくつかのプロパティ規定されています。そのようなプロパティ1 つに文字カテゴリあります。たとえば、文字は、英大文字 (uppercase letter)、英小文字 (lowercase letter)、10 進数 (decimal digit number)、レター番号 (letter number)、コネクタ区切り記号 (connector punctuation)、数学記号 (math symbol)、または通貨記号 (currency symbol) に分類できますアプリケーションは、文字カテゴリ使用して解析などの文字列ベース操作制御できます

UnicodeCategory 列挙体は、Unicode文字カテゴリ指定しますCharUnicodeInfo クラスは、特定の文字UnicodeCategory 値を取得するために使用します

CharUnicodeInfo クラスは、次の Unicode 文字プロパティ指定します

文字詳細については、Unicode Standard参照してください

使用例使用例

各種文字に対してそれぞれのメソッド返す値を次のコード例示します

Imports System
Imports System.Globalization
Imports Microsoft.VisualBasic

Public Class SamplesCharUnicodeInfo   

   Public Shared Sub Main()

      Console.WriteLine("                                    
    c  Num   Dig   Dec   UnicodeCategory")

      Console.Write("U+0061 LATIN SMALL LETTER A            ")
      PrintProperties("a"c)

      Console.Write("U+0393 GREEK CAPITAL LETTER GAMMA      ")
      PrintProperties(ChrW(&H0393))

      Console.Write("U+0039 DIGIT NINE                      ")
      PrintProperties("9"c)

      Console.Write("U+00B2 SUPERSCRIPT TWO                 ")
      PrintProperties(ChrW(&H00B2))

      Console.Write("U+00BC VULGAR FRACTION ONE QUARTER     ")
      PrintProperties(ChrW(&H00BC))

      Console.Write("U+0BEF TAMIL DIGIT NINE                ")
      PrintProperties(ChrW(&H0BEF))

      Console.Write("U+0BF0 TAMIL NUMBER TEN                ")
      PrintProperties(ChrW(&H0BF0))

      Console.Write("U+0F33 TIBETAN DIGIT HALF ZERO         ")
      PrintProperties(ChrW(&H0F33))

      Console.Write("U+2788 CIRCLED SANS-SERIF DIGIT NINE   ")
      PrintProperties(ChrW(&H2788))

   End Sub 'Main

   Public Shared Sub PrintProperties(c
 As Char)
      Console.Write(" {0,-3}", c)
      Console.Write(" {0,-5}", CharUnicodeInfo.GetNumericValue(c))
      Console.Write(" {0,-5}", CharUnicodeInfo.GetDigitValue(c))
      Console.Write(" {0,-5}", CharUnicodeInfo.GetDecimalDigitValue(c))
      Console.WriteLine("{0}", CharUnicodeInfo.GetUnicodeCategory(c))
   End Sub 'PrintProperties

End Class 'SamplesCharUnicodeInfo
 


'This code produces the following output.  Some characters might not
 display at the console.
'
'                                        c  Num   Dig   Dec   UnicodeCategory
'U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
'U+0393 GREEK CAPITAL LETTER GAMMA       \u0393   -1    -1    -1   UppercaseLetter
'U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
'U+00B2 SUPERSCRIPT TWO                  \u00B2   2     2     2    OtherNumber
'U+00BC VULGAR FRACTION ONE QUARTER      \u00BC   0.25  -1    -1   OtherNumber
'U+0BEF TAMIL DIGIT NINE                 \u0BEF   9     9     9    DecimalDigitNumber
'U+0BF0 TAMIL NUMBER TEN                 \u0BF0   10    -1    -1   OtherNumber
'U+0F33 TIBETAN DIGIT HALF ZERO          \u0F33   -0.5  -1    -1   OtherNumber
'U+2788 CIRCLED SANS-SERIF DIGIT NINE    \u2788   9     9     -1   OtherNumber

using System;
using System.Globalization;

public class SamplesCharUnicodeInfo  {

   public static void Main()
  {

      Console.WriteLine( "                                        c  Num   Dig
   Dec   UnicodeCategory" );

      Console.Write( "U+0061 LATIN SMALL LETTER A            " );
      PrintProperties( 'a' );

      Console.Write( "U+0393 GREEK CAPITAL LETTER GAMMA      " );
      PrintProperties( '\u0393' );

      Console.Write( "U+0039 DIGIT NINE                      " );
      PrintProperties( '9' );

      Console.Write( "U+00B2 SUPERSCRIPT TWO                 " );
      PrintProperties( '\u00B2' );

      Console.Write( "U+00BC VULGAR FRACTION ONE QUARTER     " );
      PrintProperties( '\u00BC' );

      Console.Write( "U+0BEF TAMIL DIGIT NINE                " );
      PrintProperties( '\u0BEF' );

      Console.Write( "U+0BF0 TAMIL NUMBER TEN                " );
      PrintProperties( '\u0BF0' );

      Console.Write( "U+0F33 TIBETAN DIGIT HALF ZERO         " );
      PrintProperties( '\u0F33' );

      Console.Write( "U+2788 CIRCLED SANS-SERIF DIGIT NINE   " );
      PrintProperties( '\u2788' );

   }

   public static void PrintProperties(
 char c )  {
      Console.Write( " {0,-3}", c );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetNumericValue( c ) );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetDigitValue( c ) );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetDecimalDigitValue( c
 ) );
      Console.WriteLine( "{0}", CharUnicodeInfo.GetUnicodeCategory( c )
 );
   }

}


/*
This code produces the following output.  Some characters might not display at the
 console.

                                        c  Num   Dig   Dec   UnicodeCategory
U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA       \u0393   -1    -1    -1   UppercaseLetter
U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO                  \u00B2   2     2     2    OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER      \u00BC   0.25  -1    -1   OtherNumber
U+0BEF TAMIL DIGIT NINE                 \u0BEF   9     9     9    DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN                 \u0BF0   10    -1    -1   OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO          \u0F33   -0.5  -1    -1   OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE    \u2788   9     9     -1   OtherNumber

*/

using namespace System;
using namespace System::Globalization;
void PrintProperties( Char c );
int main()
{
   Console::WriteLine( "                                        c  Num   Dig
   Dec   UnicodeCategory" );
   Console::Write( "U+0061 LATIN SMALL LETTER A            " );
   PrintProperties( L'a' );
   Console::Write( "U+0393 GREEK CAPITAL LETTER GAMMA      " );
   PrintProperties( L'\u0393' );
   Console::Write( "U+0039 DIGIT NINE                      " );
   PrintProperties( L'9' );
   Console::Write( "U+00B2 SUPERSCRIPT TWO                 " );
   PrintProperties( L'\u00B2' );
   Console::Write( "U+00BC VULGAR FRACTION ONE QUARTER     " );
   PrintProperties( L'\u00BC' );
   Console::Write( "U+0BEF TAMIL DIGIT NINE                " );
   PrintProperties( L'\u0BEF' );
   Console::Write( "U+0BF0 TAMIL NUMBER TEN                " );
   PrintProperties( L'\u0BF0' );
   Console::Write( "U+0F33 TIBETAN DIGIT HALF ZERO         " );
   PrintProperties( L'\u0F33' );
   Console::Write( "U+2788 CIRCLED SANS-SERIF DIGIT NINE   " );
   PrintProperties( L'\u2788' );
}

void PrintProperties( Char c )
{
   Console::Write( " {0,-3}", c );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetNumericValue( c ) );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetDigitValue( c ) );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetDecimalDigitValue( c
 ) );
   Console::WriteLine( "{0}", CharUnicodeInfo::GetUnicodeCategory( c )
 );
}

/*
This code produces the following output.  Some characters might not display at the
 console.

                                        c  Num   Dig   Dec   UnicodeCategory
U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA       \u0393   -1    -1    -1   UppercaseLetter
U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO                  \u00B2   2     2     2    OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER      \u00BC   0.25  -1    -1   OtherNumber
U+0BEF TAMIL DIGIT NINE                 \u0BEF   9     9     9    DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN                 \u0BF0   10    -1    -1   OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO          \u0F33   -0.5  -1    -1   OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE    \u2788   9     9     -1   OtherNumber

*/
import System.* ;
import System.Globalization.* ;

public class SamplesCharUnicodeInfo
{
    public static void main(String[]
 args)
    {
        Console.WriteLine("                                        c  Num "
 
            + " Dig   Dec   UnicodeCategory");

        Console.Write("U+0061 LATIN SMALL LETTER A            ");
        PrintProperties('a');

        Console.Write("U+0393 GREEK CAPITAL LETTER GAMMA      ");
        PrintProperties('\u0393');

        Console.Write("U+0039 DIGIT NINE                      ");
        PrintProperties('9');

        Console.Write("U+00B2 SUPERSCRIPT TWO                 ");
        PrintProperties('\u00B2');

        Console.Write("U+00BC VULGAR FRACTION ONE QUARTER     ");
        PrintProperties('\u00BC');

        Console.Write("U+0BEF TAMIL DIGIT NINE                ");
        PrintProperties('\u0BEF');

        Console.Write("U+0BF0 TAMIL NUMBER TEN                ");
        PrintProperties('\u0BF0');

        Console.Write("U+0F33 TIBETAN DIGIT HALF ZERO         ");
        PrintProperties('\u0F33');

        Console.Write("U+2788 CIRCLED SANS-SERIF DIGIT NINE   ");
        PrintProperties('\u2788');
    } //main
   
    public static void PrintProperties(char
 c)
    {
        Console.Write(" {0,-3}", System.Convert.ToString( c));
        Console.Write(" {0,-5}", 
            System.Convert.ToString(CharUnicodeInfo.GetNumericValue(c)));
        Console.Write(" {0,-5}", 
            System.Convert.ToString(CharUnicodeInfo.GetDigitValue(c)));
        Console.Write(" {0,-5}",
            System.Convert.ToString( CharUnicodeInfo.GetDecimalDigitValue(c)));
        Console.WriteLine("{0}", 
            System.Convert.ToString(CharUnicodeInfo.GetUnicodeCategory(c)));
    } //PrintProperties
} //SamplesCharUnicodeInfo

/*
This code produces the following output.  
Some characters might not display at the console.

                                        c  Num   Dig   Dec   UnicodeCategory
U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA       \u0393   -1    -1    -1   
UppercaseLetter
U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO                  \u00B2   2     2     2    OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER      \u00BC   0.25  -1    -1   OtherNumber
U+0BEF TAMIL DIGIT NINE                 \u0BEF   9     9     9    
DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN                 \u0BF0   10    -1    -1   OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO          \u0F33   -0.5  -1    -1   OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE    \u2788   9     9     -1   OtherNumber
*/
継承階層継承階層
System.Object
  System.Globalization.CharUnicodeInfo
スレッド セーフスレッド セーフ
この型の public static (Visual Basic では Shared) メンバはすべて、スレッド セーフです。インスタンス メンバ場合は、スレッド セーフであるとは限りません。
プラットフォームプラットフォーム
バージョン情報バージョン情報
参照参照

CharUnicodeInfo メソッド


CharUnicodeInfo メンバ

Unicode 文字に関する情報取得します。このクラス継承できません。

CharUnicodeInfo データ型公開されるメンバを以下の表に示します


パブリック メソッドパブリック メソッド
参照参照

関連項目

CharUnicodeInfo クラス
System.Globalization 名前空間
UnicodeCategory
System.Text


このページでは「.NET Framework クラス ライブラリ リファレンス」からCharUnicodeInfoを検索した結果を表示しています。
Weblioに収録されているすべての辞書からCharUnicodeInfoを検索する場合は、下記のリンクをクリックしてください。
 全ての辞書からCharUnicodeInfo を検索

英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「CharUnicodeInfo」の関連用語

CharUnicodeInfoのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



CharUnicodeInfoのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
日本マイクロソフト株式会社日本マイクロソフト株式会社
© 2025 Microsoft.All rights reserved.

©2025 GRAS Group, Inc.RSS