Module talk:Unicode data/testcases

1 of 108 tests failed.

testcases for get_best_script

testcases for get_best_script
Text Expected Actual
 Y %!?́: Zyyy (3), Zinh (1) nil nil
 Y ’ʼ“”†‡•‰′‽⁕
• Zyyy (11)
nil nil
 Y col·legi: Latn (7), Zyyy (1) Latn Latn
HTML character references
 Y 𐘀: Lina (1) Lina Lina
 Y 𐘀
• Zyyy (8), Latn (1)
Lina Lina
 Y
• Zyyy (1)
nil nil
 Y
• Latn (5), Zyyy (2)
nil nil
Halkomelem
 Y lá:yelhp: Latn (7), Zyyy (1) Latn Latn
 Y xʷməθkʷəy̓əm: Latn (10), Grek (1), Zinh (1) nil nil
 Y hən̓q̓əmin̓əm̓: Latn (10), Zinh (4) Latn Latn
Quotes
 Y Tant’è amara che poco è più morte;
ma per trattar del ben ch’i’ vi trovai,
dirò de l’altre cose ch’i’ v’ ho scorte.
• Latn (83), Zyyy (32)
Latn Latn
 Y Díí Késhmish biyiʼ yáʼąąshdę́ę́ʼ ląʼígóó bee nikʼihojidlíi dooleeł.
Niheechʼínáánáháhígíí biyiʼ iłhodeezyéél, iłhózhǫ́, ayóóʼóʼóʼní
bee nikʼihojidlíi dooleeł. Tʼáá sahdiigiʼ átʼéego baa hózhǫ́ǫgo
nihił hanááhoolzhiizhígí biyiʼ tʼáá ałtsojįʼ iłhózhǫ́ nííʼ dooleeł.
• Latn (207), Zyyy (52), Zinh (5)
Latn Latn
 Y Μῆνῐν ᾰ̓́ειδε, θεᾱ́, Πηληῐ̈ᾰ́δεω Ᾰ̓χῐλῆος
οὐλομένην, ἣ μῡρῐ́᾽ Ᾰ̓χαιοῖς ᾰ̓́λγε᾽ ἔθηκε,
πολλᾱ̀ς δ᾽ ῐ̓φθῑ́μους ψῡχᾱ̀ς Ἄῐ̈δῐ προῐ̈́ᾰψεν
ἡρώων, αὐτοὺς δὲ ἑλώρῐᾰ τεῦχε κῠ́νεσσιν
οἰωνοῖσῐ́ τε πᾶσῐ· Δῐὸς δ᾽ ἐτελείετο βουλή·
• Grek (160), Zyyy (36), Zinh (19)
Grek Grek
 Y Вот если вы не согласитесь с этим последним тезисом и
ответите: «Не так» или «не всегда так», то я, пожалуй, и
ободрюсь духом насчет значения героя моего Алексея
Федоровича. Ибо не только чудак «не всегда» частность и
обособление, а напротив, бывает так, что он-то, пожалуй,
и носит в себе иной раз сердцевину целого, а остальные
люди его эпохи — все, каким-нибудь наплывным ветром,
на время почему-то от него оторвались…
• Cyrl (329), Zyyy (93)
Cyrl Cyrl
 Y ॐ अग्निमीळे पुरोहितं यज्ञस्य देवमृत्विजम् ।
होतारं रत्नधातमम् ॥१॥
अग्निः पूर्वेभिरृषिभिरीड्यो नूतनैरुत ।
स देवाँ एह वक्षति ॥२॥
अग्निना रयिमश्नवत् पोषमेव दिवेदिवे ।
यशसं वीरवत्तमम् ॥३॥
अग्ने यं यज्ञमध्वरं विश्वतः परिभूरसि ।
स इद्देवेषु गच्छति ॥४॥
अग्निर्होता कविक्रतुः सत्यश्चित्रश्रवस्तमः ।
देवो देवेभिरा गमत् ॥५॥
यदङ्ग दाशुषे त्वमग्ने भद्रं करिष्यसि ।
तवेत् तत् सत्यमङ्गिरः ॥६॥
उप त्वाग्ने दिवेदिवे दोषावस्तर्धिया वयम् ।
नमो भरन्त एमसि ॥७॥
राजन्तमध्वराणां गोपामृतस्य दीदिविम् ।
वर्धमानं स्वे दमे ॥८॥
स नः पितेव सूनवेऽग्ने सूपायनो भव ।
सचस्वा नः स्वस्तये ॥९॥
• Deva (449), Zyyy (109)
Deva Deva

testcases for is_Latin

testcases for is_Latin
Text Expected Actual
 Y %!?́: Zyyy (3), Zinh (1) false false
 Y ’ʼ“”†‡•‰′‽⁕
• Zyyy (11)
false false
 Y col·legi: Latn (7), Zyyy (1) true true
HTML character references
 Y 𐘀: Lina (1) false false
 Y 𐘀
• Zyyy (8), Latn (1)
false false
 Y
• Zyyy (1)
false false
 Y
• Latn (5), Zyyy (2)
false false
Halkomelem
 Y lá:yelhp: Latn (7), Zyyy (1) true true
 Y xʷməθkʷəy̓əm: Latn (10), Grek (1), Zinh (1) false false
 Y hən̓q̓əmin̓əm̓: Latn (10), Zinh (4) true true
Quotes
 Y Tant’è amara che poco è più morte;
ma per trattar del ben ch’i’ vi trovai,
dirò de l’altre cose ch’i’ v’ ho scorte.
• Latn (83), Zyyy (32)
true true
 Y Díí Késhmish biyiʼ yáʼąąshdę́ę́ʼ ląʼígóó bee nikʼihojidlíi dooleeł.
Niheechʼínáánáháhígíí biyiʼ iłhodeezyéél, iłhózhǫ́, ayóóʼóʼóʼní
bee nikʼihojidlíi dooleeł. Tʼáá sahdiigiʼ átʼéego baa hózhǫ́ǫgo
nihił hanááhoolzhiizhígí biyiʼ tʼáá ałtsojįʼ iłhózhǫ́ nííʼ dooleeł.
• Latn (207), Zyyy (52), Zinh (5)
true true
 Y Μῆνῐν ᾰ̓́ειδε, θεᾱ́, Πηληῐ̈ᾰ́δεω Ᾰ̓χῐλῆος
οὐλομένην, ἣ μῡρῐ́᾽ Ᾰ̓χαιοῖς ᾰ̓́λγε᾽ ἔθηκε,
πολλᾱ̀ς δ᾽ ῐ̓φθῑ́μους ψῡχᾱ̀ς Ἄῐ̈δῐ προῐ̈́ᾰψεν
ἡρώων, αὐτοὺς δὲ ἑλώρῐᾰ τεῦχε κῠ́νεσσιν
οἰωνοῖσῐ́ τε πᾶσῐ· Δῐὸς δ᾽ ἐτελείετο βουλή·
• Grek (160), Zyyy (36), Zinh (19)
false false
 Y Вот если вы не согласитесь с этим последним тезисом и
ответите: «Не так» или «не всегда так», то я, пожалуй, и
ободрюсь духом насчет значения героя моего Алексея
Федоровича. Ибо не только чудак «не всегда» частность и
обособление, а напротив, бывает так, что он-то, пожалуй,
и носит в себе иной раз сердцевину целого, а остальные
люди его эпохи — все, каким-нибудь наплывным ветром,
на время почему-то от него оторвались…
• Cyrl (329), Zyyy (93)
false false
 Y ॐ अग्निमीळे पुरोहितं यज्ञस्य देवमृत्विजम् ।
होतारं रत्नधातमम् ॥१॥
अग्निः पूर्वेभिरृषिभिरीड्यो नूतनैरुत ।
स देवाँ एह वक्षति ॥२॥
अग्निना रयिमश्नवत् पोषमेव दिवेदिवे ।
यशसं वीरवत्तमम् ॥३॥
अग्ने यं यज्ञमध्वरं विश्वतः परिभूरसि ।
स इद्देवेषु गच्छति ॥४॥
अग्निर्होता कविक्रतुः सत्यश्चित्रश्रवस्तमः ।
देवो देवेभिरा गमत् ॥५॥
यदङ्ग दाशुषे त्वमग्ने भद्रं करिष्यसि ।
तवेत् तत् सत्यमङ्गिरः ॥६॥
उप त्वाग्ने दिवेदिवे दोषावस्तर्धिया वयम् ।
नमो भरन्त एमसि ॥७॥
राजन्तमध्वराणां गोपामृतस्य दीदिविम् ।
वर्धमानं स्वे दमे ॥८॥
स नः पितेव सूनवेऽग्ने सूपायनो भव ।
सचस्वा नः स्वस्तये ॥९॥
• Deva (449), Zyyy (109)
false false

testcases for is_combining

testcases for is_combining
Text Expected Actual
 Y U+0300: ◌̀ (COMBINING GRAVE ACCENT) true true
 Y U+0060: ` (GRAVE ACCENT) false false

testcases for is_default_ignorable

testcases for is_default_ignorable
Text Expected Actual

testcases for is_rtl

testcases for is_rtl
Text Expected Actual
 Y أبو عبد الله محمد بن عبد الله اللواتي الطنجي بن بطوطة true true
 Y أدب القاضي Adab al-qādī false false
 Y ܛܘܼܒܲܝܗܘܿܢ ܠܐܲܝܠܹܝܢ ܕܲܕ݂ܟܹܝܢ ܒܠܸܒ̇ܗܘܿܢ܄ ܕܗܸܢ݂ܘܿܢ ܢܸܚܙܘܿܢ ܠܐܲܠܵܗܵܐ܂‬ true true
 Y בְּרֵאשִׁית, בָּרָא אֱלֹהִים, אֵת הַשָּׁמַיִם, וְאֵת הָאָרֶץ. true true
 Y 𞤀𞤣𞤤𞤢𞤥 𞤆𞤵𞤤𞤢𞤪 true true
 Y 𐬬𐬍𐬯𐬞𐬈 ⸱ 𐬰𐬍 ⸱ 𐬀𐬥𐬌𐬌𐬉 ⸱ 𐬨𐬀𐬜𐬃𐬢𐬵𐬋 ⸱ 𐬀𐬉𐬴𐬨𐬀 ⸱ 𐬵𐬀𐬗𐬌𐬧𐬙𐬈 ⸱ 𐬑𐬭𐬎𐬎𐬍𐬨 ⸱ 𐬛𐬭𐬎𐬎𐬋 ⸱ 𐬁𐬀𐬝 ⸱ 𐬵𐬋 ⸱ 𐬫𐬋 ⸱ 𐬵𐬀𐬊𐬨𐬀𐬵𐬈 ⸱ 𐬨𐬀𐬜𐬋 ⸱ 𐬀𐬴𐬀 ⸱ 𐬵𐬀𐬗𐬀𐬌𐬙𐬈 true true
 Y ދިވެހި true true
 Y 𐤀𐤓𐤍𐤟𐤆𐤐𐤏𐤋𐤟𐤀𐤕𐤁𐤏𐤋𐤟𐤁𐤍𐤀𐤇𐤓𐤌𐤟𐤌𐤋𐤊𐤂𐤁𐤋𐤟𐤋𐤀𐤇𐤓𐤌𐤟𐤀𐤁𐤄 true true
 Y ࡌࡀࡍࡃࡀ ࡖࡄࡉࡉࡀ true true
 Y ࠄࠟࠓࠂࠝࠓࠜࠉࠆࠜࠉࠌ true true
 Y %$!^& false false

testcases for lookup_age

testcases for lookup_age
Text Expected Actual

testcases for lookup_block

testcases for lookup_block
Text Expected Actual
 Y U+0064: d Basic Latin Basic Latin
 Y U+030B: ◌̋ Combining Diacritical Marks Combining Diacritical Marks
 Y U+03A3: Σ Greek and Coptic Greek and Coptic
 Y U+0411: Б Cyrillic Cyrillic
 Y U+10E6: ღ Georgian Georgian
 Y U+3175: ㅵ Hangul Compatibility Jamo Hangul Compatibility Jamo
 Y U+AC01: 각 Hangul Syllables Hangul Syllables
 Y U+4E0A: 上 CJK Unified Ideographs CJK Unified Ideographs
 Y U+1F608: 😈 Emoticons Emoticons
 Y U+30000: 𰀀 CJK Unified Ideographs Extension G CJK Unified Ideographs Extension G
 Y U+10FFFF Supplementary Private Use Area-B Supplementary Private Use Area-B

testcases for lookup_category

testcases for lookup_category
Text Expected Actual
 Y U+0009 (<control-0009>) Cc Cc
 Y U+0020: (SPACE) Zs Zs
 Y U+005B: [ (LEFT SQUARE BRACKET) Ps Ps
 Y U+005D: ] (RIGHT SQUARE BRACKET) Pe Pe
 Y U+005E: ^ (CIRCUMFLEX ACCENT) Sk Sk
 Y U+0041: A (LATIN CAPITAL LETTER A) Lu Lu
 Y U+00AD (SOFT HYPHEN) Cf Cf
 Y U+00BE: ¾ (VULGAR FRACTION THREE QUARTERS) No No
 Y U+00AB: « (LEFT-POINTING DOUBLE ANGLE QUOTATION MARK) Pi Pi
 Y U+00BB: » (RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK) Pf Pf
 Y U+0300: ◌̀ (COMBINING GRAVE ACCENT) Mn Mn
 Y U+0488: ҈ (COMBINING CYRILLIC HUNDRED THOUSANDS SIGN) Me Me
 Y U+0663: ٣ (ARABIC-INDIC DIGIT THREE) Nd Nd
 Y U+5B50: 子 (CJK UNIFIED IDEOGRAPH-5B50) Lo Lo
 Y U+1FAE: ᾮ (GREEK CAPITAL LETTER OMEGA WITH PSILI AND PERISPOMENI AND PROSGEGRAMMENI) Lt Lt
 Y U+1B44: ◌᭄ (BALINESE ADEG ADEG) Mc Mc
 Y U+2208: ∈ (ELEMENT OF) Sm Sm
 Y U+203F: ‿ (UNDERTIE) Pc Pc
 Y U+21B9: ↹ (LEFTWARDS ARROW TO BAR OVER RIGHTWARDS ARROW TO BAR) So So
 Y U+2E17: ⸗ (DOUBLE OBLIQUE HYPHEN) Pd Pd
 Y U+2167: Ⅷ (ROMAN NUMERAL EIGHT) Nl Nl
 Y U+2028 (LINE SEPARATOR) Zl Zl
 Y U+2029 (PARAGRAPH SEPARATOR) Zp Zp
 Y U+309E: ゞ (HIRAGANA VOICED ITERATION MARK) Lm Lm
 Y U+D800 (<surrogate-D800>) Cs Cs
 Y U+FFE1: £ (FULLWIDTH POUND SIGN) Sc Sc
 N U+FFFF (<noncharacter-FFFF>) Cn nil
 Y U+100000 (<private-use-100000>) Co Co

testcases for lookup_name

testcases for lookup_name
Text Expected Actual
 Y U+0000 <control-0000> <control-0000>
 Y U+007F <control-007F> <control-007F>
 Y U+00C1: Á LATIN CAPITAL LETTER A WITH ACUTE LATIN CAPITAL LETTER A WITH ACUTE
 Y U+0300: ◌̀ COMBINING GRAVE ACCENT COMBINING GRAVE ACCENT
 Y U+0378 <reserved-0378> <reserved-0378>
 Y U+1B44: ◌᭄ BALINESE ADEG ADEG BALINESE ADEG ADEG
 Y U+1F71: ά GREEK SMALL LETTER ALPHA WITH OXIA GREEK SMALL LETTER ALPHA WITH OXIA
 Y U+3555: 㕕 CJK UNIFIED IDEOGRAPH-3555 CJK UNIFIED IDEOGRAPH-3555
 Y U+AC01: 각 HANGUL SYLLABLE GAG HANGUL SYLLABLE GAG
 Y U+D5FF: 헿 HANGUL SYLLABLE HEH HANGUL SYLLABLE HEH
 Y U+DC00 <surrogate-DC00> <surrogate-DC00>
 Y U+EEEE <private-use-EEEE> <private-use-EEEE>
 Y U+FDD1 <noncharacter-FDD1> <noncharacter-FDD1>
 Y U+FFFD: � REPLACEMENT CHARACTER REPLACEMENT CHARACTER
 Y U+FFFF <noncharacter-FFFF> <noncharacter-FFFF>
 Y U+1F4A9: 💩 PILE OF POO PILE OF POO
 Y U+E0000 <reserved-E0000> <reserved-E0000>
 Y U+F0F0F <private-use-F0F0F> <private-use-F0F0F>
 Y U+10FFFF <noncharacter-10FFFF> <noncharacter-10FFFF>

testcases for lookup_script

testcases for lookup_script
Text Expected Actual
 Y U+0061: a (LATIN SMALL LETTER A) Latn Latn
 Y U+002F: / (SOLIDUS) Zyyy Zyyy
 Y U+0300: ◌̀ (COMBINING GRAVE ACCENT) Zinh Zinh
 Y U+0378 (<reserved-0378>) Zzzz Zzzz
 Y U+0398: Θ (GREEK CAPITAL LETTER THETA) Grek Grek
 Y U+03E2: Ϣ (COPTIC CAPITAL LETTER SHEI) Copt Copt
 Y U+2014: — (EM DASH) Zyyy Zyyy