そいつぁつらいぜ分室 〜駐在員細田の語学学習〜

ドイツ駐在員細田がドイツで語学を学びます。主に英語とドイツ語の学習記録。本家はこちら→http://o81hosoda.hatenablog.com/

ドイツ語初級の単語をどう学ぶか 〜独和のAnkiデッキ4000語を作ってみた〜

こんにちは、細田です。

英語の学習と平行する余裕が少し出てきたので、最近ドイツ語の勉強をはじめました。

まずは初級程度のドイツ語を学習する足がかりとして、最頻出単語を覚えていこうと思い立ちました。

 

んで、これまでの実績に基づいてAnkiのデッキを作ってみました

ドイツ語→日本語のAnkiデッキの自作例はあまり多くないと思いますので、今後ドイツ語学習を目指す方々の参考になればと思い、ここに記録しておくことにしました。
以下の試行錯誤を経て一応頻度順に4000語のデッキを作成することができました。最後に、そのうち1000語を覚えた上での感想を記しています。

英語ほど学習環境の整っていない、第二外国語学習法の一助となれば幸いです。

 

なぜ細田は文法から入らないのか

まず、なぜ私が文法から入らないのか?と、単語をある程度先にインプットすることの重要性について書いておく必要があります。

①初級文法は(忘れてるけど)学習済なので

まず第一は、個人的な学習経験に依る理由です。
ドイツ語は第二外国語として大学時代に履修していたこともあり、大枠の基礎文法はうっすら覚えており、単語さえわかれば文章は読める、という感じの現状です。
「単語さえわかれば」というのがミソで、文構造はわかっていても即座に読めないので結構もどかしいです。この現状からステップアップするには、単語を覚えるのが手っ取り早い、というのがひとつめの理由です。

文法の再学習に使っている参考書は追って他エントリーで紹介したいと思っています。


②意味や性別、変化形を先にある程度知っていたほうが文法の学習も速く進む

ドイツ語は英語に比べて語順の制約が少なく、目的語を文頭に持ってきたり、主語を動詞の後ろに持ってきたりと、伝えたい情報の優先度に応じて語順をフレキシブルに変化させることができます。
一方、文中における各々の役割を明確にするために、「格」とそれに応じた「格変化」の概念があり、これをしっかり運用できないと、正しいドイツ語を書いたり話したりすることはできません。(勉強中ですのでこれ以上の詳細は文法書に譲ります)
格変化の対象のうちの一つである名詞ですが、姓(男性・女性・中性)と4種類の格変化があり、名詞や形容詞の語尾が格に応じて変化します。
その他に細かい理由もあり、名詞の性別と複数形(英語のよりも不規則)、不規則変化動詞の人称変化/過去形/過去分詞形などを先に覚えておくと、今後の文法学習が非常にスムーズになりそうだという判断がふたつめの理由です。

 

語義リストと頻度情報の獲得

それでは手軽にゲットできる頻度情報とドイツ語→日本語対訳のセットを探してみます。

1. Ankiの共有デッキ

Ankiの共有デッキにドイツ語→英語の4000語のリストがあるので、一晩使ってみることに。そのまま使えればこれがいちばん手っ取り早い。
しかし、「名詞の性別が書かれていない」「動詞の活用、過去形・過去分詞形が書かれていない」「"rank"と書かれた難易度設定(?)に疑問がある」などの問題があることがわかってきました。

2.ネットで探す

そこで、Ankiデッキに変換できそうな独→日の単語リストをネットの海でちょっくら探してみました。
ドイツ語学習においては、「英辞郎」のような手軽に加工できる語義データがありません。なので、英語学習界隈で流行っているようなデータ加工の手段が整備されていないように感じました。なので今回、信頼できそうな語義データを見つけることが一つの目標でもありました。
結果、一つで完成されたファイルはなかったものの、前出の共有デッキと単語数が同程度以上のリストを2つ見つけることができました。それぞれのいいとこを結合して頻度順独日デッキを作ることにしました。
簡単に言うと、「見出し語+語義その他がまとまったリスト」に、②「頻度別にカテゴライズされた見出し語集の頻度情報」を統合することで、前者のリストを頻度別にソートしてデッキ化します。以下5段階でやり方を記しておきます。


①語義つき単語リスト4000語(頻度情報なし)の発掘

http://www.geocities.jp/tosaka_m/Germany/Vokabel.html

個人サイトです。見出し語4000に語義・例文・複数形/不規則変化などの情報をつけてくれています。
『全部の単語をマスターすると、 日常的な 会話や文の八割はカバーできるはずです(?)。』
とあります。ドイツ滞在経験のある方だそうなので、本人実感による生々しい感想だと思われます。
語義や例文の出典が明記されていないのがちょっと気になりますが、ほかによさげで大きなリストがないのでひとまず信じてやってみましょう。


良い点 ドイツ語と日本語で分けたテキストファイルで頒布。容易にエクセルシート化可。
悪い点 頻度別のタグがないに等しい。このままだとアルファベット順に4000語覚えきるまで自分の実力に穴が生じやすい。


頻度情報は後で付け加えるので、ひとまずサイトにある2個のテキストファイルをDLしましょう。
excelにコピペし、「見出し語」「品詞/変化」「語義」「複数形/時制による変化」「例文・独」「例文・和」「カテゴリー」の順に列を作り、1枚のシートにして保存します。

f:id:O81hosoda:20190210095610p:plain

②頻度順単語リスト5000語(見出し語のみ)の発掘

http://moz.la.coocan.jp/index.html

作成は静岡大のドイツ文化の先生でしょうか。コーパスに基づく頻度リストなどを参考に5段階にレベル分けしているそうです。SVL(英単語12000語の頻度・重要度順リスト)っぽい分割の仕方です。

『テクストの種類にもよりますが,基本単語5000語でドイツ語のテクストの少なくとも80~90%程度をカバーすることができます。感覚的に言えば,ドイツ語を読んでいて,1行~2行に1回程度,未知の単語が出てくるという感じです。』

この全単語を同じシートにコピペ。1Aから5までの5000語を全部同じシートに貼り付けるのがミソです。単語の右のセルにレベルを表記しておきましょう。

f:id:O81hosoda:20190210095719p:plain

これを2枚めのシートとして保存。

③ ①のセルに②から得た頻度情報を紐付ける

1枚めのシートの「カテゴリー」の右隣に関数「VLOOKUP」で2枚目のシートに記したレベルを紐付ける。
1単語目FußはA2に配置されていますから、この単語のレベルを頻度情報タグから検索します。以下の関数をH2に書き込みます。

=VLOOKUP(A2, (頻度情報5000語のシート名)!$A$1:$B$5000, 2, FALSE)

これを下に4000個がーーーっとペーストしていけば終わりです。
twitterのフォロワーさん、地獄の手動検索夜なべコースを始める前に教えてくださってありがとうございます。)

すると語義つき4000語(正確には4000語ちょい)は以下のように割り振られます。スラッシュの右側は5000語の方のレベル別単語数。

Lv1A 505/500
Lv1B 500/500
Lv2 825/1000
Lv3 666/1000
Lv4 452/1000
Lv5 284/1000
Uncategorized 782

レベル1はほぼ100%合致(同一見出し語で語義の大きく異なるものが分割されているため、5語オーバーしている)。レベルが高くなるに従って抜け落ちが多くなってくる印象です。
レベル4以降の抜け落ちがちょっと不安ですが、ひとまず『日常的な会話や文の8割をカバー』しているとの証言を信じてみましょう。

レベル5までに収納されなかった見出し語(uncategorized)の中には、括弧つきで冠詞との結合のバリエーションが書かれていたためVLOOKで完全一致しなかった前置詞や、複合語(ex. Handgelenk 手の関節/手首)、代名詞、国名、職業、女性化された一般名詞(Gewinnerin 女性の当選者)、食材などが含まれていました。このへんをなんとかしたければ、手打ちで移動させるほかなさそうです。
ただ、これらも重要な構成要素であるには変わりないですが、文法の基礎事項であったり、Lv5までの単語を知っていれば推測できるものも多いので、今回はスピードを重視して目をつぶることにしました。

④タブ区切りテキストファイル化

頻度が記録されている単語のうち1000語が消えてしまうのはちょっと残念ですが、現状致し方ありません。
Ankiで簡単に動かせそうな初中級者向けの大きなリストはこれ以上なさそうなので、腹をくくってこれをデッキ化することにします。
まずは4000語をレベルごとに並び替えて、1レベルずつ切り分けて6つのエクセルファイルを作成します(1Aと1Bは別ファイルにカウントしました)。

 

f:id:O81hosoda:20190210095921p:plain

レベル1Aのファイル冒頭が、このようになっていればよいでしょう。


これをAnkiのデスクトップソフトが読み込めるよう、タブ区切りテキストファイルにしていきます(エクセルからテキストファイル形式で保存)。
単純にタブ区切りテキストファイルに変更すると、環境によってはドイツ語固有のアルファベットが潰れてしまう危険があるので、気をつけてください。
環境によって対処の仕方も違うと思いますが、macでは以下のようにすると解決しました。ご参考までに。


※テキストエンコーディングの注意
macの場合UTF-8にしないとAnkiのデスクトップソフトへのインポートが通らないが、Shift-JISからダイレクトに変換するとウムラウトなどの特殊文字が全部「_」になってしまう。これを回避するためにまずexcelからUTF-16でテキストファイル化し、テキストエディタで開いて複製。名称変更からUTF-8に変更。これでウムラウトが潰れない。

 

⑤デッキの用意、インポート

デッキを用意します。まず4000語リスト用に「Note Type」を編集します。
今回は単語の意味とその他活用を覚えることを目的としていますので、見出し語を表にして、活用・複数形・語義を一度に連想して答え合わせする構成にしています。
うまくやるとデッキがこのように構成されます。

f:id:O81hosoda:20190210100155p:plain

慣れてきたら例文を表に表示して独作文するのもよいかもしれません。
さて、インポートして各列を間違いなく関連付けたら、最後にウムラウトエスツェットの潰れがないことを簡単に確認し、おしまい。

あとは覚えるだけ!!(これが一番大変)

 

 

レベル1を覚えきってみた感想

レベル1の1000語を覚え切ってみました。
街にある看板や、スーパーの広告なんかは少し読みやすくなった感じがします。確かに頻度高く見かける単語もいっぱいあり、初級ドイツ語の実力醸成という目的に対しては確実に有用なリストだとおもいました
一方、本リストでは「りんご」や「犬」より「戦争」や「権利の行使」の頻度が高いことになっているので、頻度制定の際に取得したテキスト群にちょっと偏りがあるのでは?という感じもしました。
今回は独和ペアのリストと頻度データの両方をネットの無料情報に頼っているので、今後4000語以上の単語を覚える必要に駆られた際にはもう一工夫しないといけないと感じます。よい方法があったらご教示いただけると幸いです。

 

独検3級あたりまでで1600語とのことなので、このぐらいまではひとしきり突っ走って行きたいですね。