Häufigsten japanischen Zeichen?
Ich frage mich welche der japanischen Silbenzeichen am häufigsten sind?
Im deutschen gibt es eine solche statistik.
bspw: E - 17,41%, N - 9,78% usw.
2 Antworten
Du könntest beispielsweise einfach mal im Internet nach „hiragana frequency“ suchen. Das liefert dann Seiten, wie diese...
https://gawron.sdsu.edu/crypto/lectures/hiragana.html
Da findet man dann relative Häufigkeiten von Hirgana. Hier die konkrete Häufigkeitstabelle:
https://gawron.sdsu.edu/crypto/japanese_models/hir_freq.html
Hiragana Frequency Table
う u 0.074
ん n' 0.069
い i 0.066
し shi 0.041
き ki 0.031
に ni 0.030
[...]
Grundlage für die Haufigkeitstabelle, waren wohl einige Nachrichten-Artikel. Wobei zu beachten ist, dass im Text vorkommende Wörter, die mit Kanji geschrieben wurden, für die Analyse auch in Hiragana umgewandelt wurden. Hier findet man ein Beispiel, welches für die Zählung der Hiragana verwendet wurde...
https://gawron.sdsu.edu/crypto/japanese_models/news_sample_hir.html
Ich kann mir durchaus vorstellen, dass die Häufigkeitsverteilung evtl. anders aussehen würde, wenn man Kanji extra betrachtet hätte. Das ist halt eines der Probleme bei solch einer Untersuchung: Es gibt mehrere Schriftsysteme (Kanji, Hiragana, Katakana), die im Japanischen gemischt verwendet werden. Je nach Kenntnisstand bzw. Präferenz von Autor und Zielgruppe, kann ein Wort mal in Kanji und mal in Hiragana geschrieben zu finden sein. Einmal trägt das Wort dann keine Hiragana bei und einmal eben doch. Was zählt man nun?
ich habe nur mal gehört das man rein mit Katakana und Hiragana vieles schrieben kann. Kanji werden oft in höheren bereichen genutzt.
Ja, man kann theoretisch alles mit Hirgana bzw. Katakana schreiben.
Und so hoch sind die „höheren Bereiche“, von denen du sprichst, nicht. Man wird nur relativ selten einen Text finden, der komplett mit Hiragana bzw. Katakana geschrieben wurde. Am ehesten noch in Kinderbüchern für Kinder, die noch keine oder nur wenige Kanji können.
In den meisten normalen Texten wird der größte Teil an Wörtern mit Kanji geschrieben. Hiragana erfüllen dann eher grammatikalische Funktionen. (Es gibt auch Wörter die man üblicherweise eher in Hiragana geschrieben findet, Wörter ausländischen Ursprungs werden häufig mit Katakana geschrieben, etc. Aber das alles ändert nichts daran, das Kanji nun einmal einen Großteil normaler japanischer Texte ausmachen.)
Die Frage ist nun: Möchte man zählen, wie häufig die einzelnen Hiragana in japanischen Texten vorkommen würden, wenn man alles mit Hiragana schreiben würde? Oder möchte man zählen, wie häufig die einzelnen Hiragana tatsächlich in japanischen Texten stehen, so wie die Texte nun einmal geschrieben sind?
============
Ich habe mal einfach ein paar News-Artikel von asahi.com hergenommen und da (ohne vorige Umwandlung in Hiragana) gezählt, wie oft welche Hiragana darin vorgekommen sind.
Hier kannst du den zusammengefügten Text finden, den ich als Grundlage für meine Zählung verwendet habe: https://pastebin.com/raw/e0q6cPkk
Der Text besteht aus 20317 Zeichen (Kanji, Hiragana, Katakana, lateinische Buchstaben, sonstige Zeichen). Darin befinden sich 2829 Hiragana. Die Verteilung der einzelnen Hiragana sieht da folgendermaßen aus:
の 8,70%
た 5,94%
と 5,37%
を 5,13%
い 5,05%
に 5,02%
し 4,70%
て 4,28%
は 4,24%
る 3,99%
が 3,96%
で 3,15%
な 2,65%
か 2,58%
っ 2,37%
す 1,98%
ら 1,98%
れ 1,70%
も 1,59%
り 1,52%
う 1,48%
ま 1,45%
ど 1,45%
さ 1,31%
き 1,20%
ん 1,20%
こ 1,17%
あ 1,03%
め 1,03%
だ 0,99%
よ 0,88%
く 0,81%
つ 0,78%
え 0,71%
け 0,67%
や 0,67%
わ 0,53%
そ 0,46%
ち 0,46%
お 0,42%
み 0,42%
ろ 0,39%
ば 0,39%
せ 0,35%
ほ 0,35%
べ 0,35%
ご 0,32%
げ 0,28%
じ 0,28%
む 0,25%
ず 0,21%
ね 0,18%
へ 0,18%
ひ 0,14%
ゆ 0,14%
づ 0,14%
ゃ 0,14%
ぐ 0,11%
ざ 0,11%
び 0,11%
ぶ 0,11%
ぼ 0,11%
ふ 0,07%
ぜ 0,07%
ゅ 0,07%
ぎ 0,04%
ぞ 0,04%
ぱ 0,04%
ょ 0,04%
ぬ 0,00%
ぢ 0,00%
ぴ 0,00%
ぷ 0,00%
ぺ 0,00%
ぽ 0,00%
ich hab es eigentlich mir so gedacht das ich hiragana und katakana kombiniert nehme und dann die 30 häufigsten nehme und sie dem deutschen gleich setze. Ich versuche nämlich für eine geschichte eine eigene schrift zu entwickeln.
https://www.excite.co.jp/news/article/00091179941794/
Laut dem Artikel in dem obigen Link ist das häufigste Hiragana das い mit 8%.
ja das das japanische 3 schriftsxsteme hat ist mir klar. ich habe nur mal gehört das man rein mit Katakana und Hiragana vieles schrieben kann. Kanji werden oft in höheren bereichen genutzt. kann mich auch irren. also würde ich jetzt rein Hiragana und Katakana nehmen.