LARP at SCUコーパス配布のご案内

こちらでは、本学主催の日本語習得研究プロジェクトLARP at SCU2004年〜2011年)の成果である、学習者言語コーパスについてご案内しております。研究目的であれば、どなたでもご利用いただけます。お気軽にお問い合わせください。

LARP at SCU とは?

LARPとは、Language Acquisition Research Project の略です。また後の SCU は、台湾の東呉大学(英語名 Soochow University)の略です。日本語学習者の言語習得プロセスを研究する非営利プロジェクトです。

LARP at SCU 学習者言語コーパスとは?

本プロジェクトは「台湾における外国語としての日本語習得研究」の発展のため、3年半にわたって毎月収集した大学生の日本語使用を記録しました。データはテキストファイル、および作文原稿のスキャナ画像の形で配布されます。

お問い合わせはこちらまで

郵便番号:111
住所:台湾 台北市士林區臨溪路70
東呉大学外語学院日本語文学系

陳 淑娟 教授
Email:
chensuc4@scu.edu.tw

 


關於LARP at SCU語料庫

代表:陳 淑娟

歡迎各位來到LARP at SCU語料庫網站,首先容我介紹一下本語料庫的建立經過,同時竭誠歡迎對日語習得研究有興趣的同好,充分利用本語料庫,進入語言習得研究的世界。

LARP at SCULanguage Acquisition Research Project at Soochow University的略稱,而Soochow University(台灣)東吳大學的英文名稱,是東吳大學日本語文學系老師與研究生們爲了研究「學生的日語成長」而啟動的研究團體,由我發起,結合本系專兼任同好的老師與研究生數十名,於20043月開始策劃,執行「日語習得研究」,稱為LARP at SCU

   當年日本的日語習得研究大師長友和彥教授至本校任教,講授習得研究,我們從長友教授言談得到了很大的啟發,尤其覺得台灣日文系學生在4年接觸日語期間,能力確實有長足的變化,從零開始學習,至4年級畢業前,已經擁有「一般言談」能力,或甚至擔任「導遊」「日語秘書」「口譯」能力,到底在什麼階段?日文如何變化?值得我們長期追蹤紀錄,探討能力發達的過程,因此成立了LARP at SCU,一邊研讀習得論文,一邊計劃性採集學生的日語語料。

    招募了當年日文系一年級37名學生,同意協助每個月寫一次作文,同時接受一對一訪談,直至畢業。於是自2004317日開始至2007516日為期三年半,除了寒暑假外,於固定的LARP日,請學生在同一教室書寫作文。執行順序是:

1.  同一題目,不查字典,書寫約600字作文。(此為第一稿)

2.  寫完作文學生與老師一對一,分別於固定教室,錄音訪談。

3.  首先讓學生朗讀作文一次,之後針對作文進行日文訪談,訪談時間20分鐘,要領是針對作文不自然之處、確認內容重點的方法進行。

4.  訪談完畢,讓學生針對自己的作文,自行訂正的方式,重新騰稿。(此為第二稿)

5.  學生朗誦第二稿,錄音下來。

6.  老師帶回錄音帶與兩份稿紙,自行打字檔案化儲存,包含第一稿、訪談內容文字化、第二稿。

   之後由專人匯整所有的文字稿,提供研究團體成員研究學生的語言成長變化。

3年半期間學生人數漸漸遞減,長期完整參與的有26名。留下來的同學一致認為「對自己學習日文有幫助」。而三年半期間,研究團體的老師、研究生人數也有變化,前前後後參與「訪談」、「文字檔建立」的人數約為100人,語料庫建構完成至可以公開使用為時5年。

此計畫獲國科會專題計畫案(NSC.94-2411-H-031-010-NSC.95-2411-H-031-010-NSC.96-2411-H-031-020-NSC.97-2410-H-031-038-MY3)補助,聘請的兼任助理以及日文系協助工讀人數達22人,靠著共同的合作努力,方得以建構完成此語料庫,於此語料庫第二版完成校對公開前夕,衷心感謝所有參與者的努力,我們已經完成了階段性的任務,接下來我們期待有興趣的研究者,利用此語料研究台灣學生的日語習得成長,包含聲音、文字、各項文法、談話等項目,結合大家的研究成果,期待可以釐清學習的次第,日語進展的原則等。

 

 


 

LARP at SCU コーパスのご案内

 

代表: 陳 淑娟

 

LARP at SCU のページへようこそ。まず本プロジェクトのコーパス構築の経緯をご紹介いたします。日本語習得研究に皆様が関心をお持ちになり、このコーパスを存分に活用され、言語習得研究の世界に踏み入っていただければ幸いに存じます。

LARP at SCULanguage Acquisition Research Project at Soochow Universityの略称です。Soochow Universityは台湾の東呉大学の英語名です。本プロジェクトは東呉大学日本語文学系の教師及び院生らが、「学生の日本語の成長」を研究するために動き出した研究グループです。私の呼び掛けに、本学の専任、兼任の先生方、院生らが数十人応えてくださいました。20043月に「日本語習得研究」の活動を開始し、LARP at SCU誕生の運びとなりました。

その年、日本における日本語習得研究の第一人者である長友和彦教授が本学で教鞭を取られ、言語習得についてご講義くださいました。長友教授のご指導に我々は大いに啓発されました。特に台湾の日本語学科の学生たちは日本語と接触する4年間の間に、その能力は確実に大きく変化いたしますが、ゼロの状態から始め、4年生が卒業する間際には、一般的な言語技能に加え、観光ガイドや日本語による秘書業務、通訳の能力などを身につけます。そのような日本語が一体どの段階で獲得されたのでしょうか。また学生たちの日本語がどのように変化していったのでしょうか。こうした面を長期にわたり追跡記録し、能力の発達過程を深く考察する価値があります。そこでLARP at SCUを立ち上げ、習得に関する論文の研究会を実施しながら、一方で学生たちの日本語資料の収集を進めて参りました。

その年度本学日本語学科に入学した37名の学生諸君に協力を求め、卒業までの期間、毎月一回作文を書き、同時にその作文のフォローアップインタビューを受けてもらいました。2004317日から2007516日までの夏期冬期の休みを除いた3年半にわたり、毎月1回「LARPの日」というのを決めて、1つの教室に集まってもらい、作文を書いてもらいました。1回のセッションは以下の手順で進行いたしました。

1.学生全員が同一のタイトルで作文を書く。辞書は使用不可。長さは約600字。(1稿)

2.作文が完成した学生は別の教室に移り、教師と11でフォローアップインタビューをカセットテープに録音する。

3.まず学生が1度作文を朗読し、その後作文の内容に沿って日本語で会話をする。会話の時間は20分。会話は以下2点に重点を置いて進行した。作文の不自然な点、内容の確認

4.インタビュー完了後、学生が第1稿を自己修正し、もう1度最初から書き直す(2稿)

5.学生が第2稿を朗読し、それを録音する。

6.カセットテープと原稿2枚を教師が回収し、第1稿、録音内容、第2稿全てをタイプし文字化する。

 

その後専門のスタッフが文字化された資料の整理を行ない、学生の言語の成長変化を研究するグループのメンバーに資料を提供いたしました。3年半の間に学生の数が徐々に減り、最後まで協力してくれた者は26名でしたが、残ってくれた学生諸君は一様に「自分の日本語学習に有益であった」と感じてくれております。また三年半の間、研究グループの教師や大学院生にも増え、「フォローアップインタビュー」や「文字起し」にご参加いただいた方々は、プロジェクトが完成し資料が公開できるようになるまでの5年間に、約100名にも上りました。

この計画は台湾国科会の專題計畫案の補助(日本でいう科研費)を受け、兼任助手や日本語学科のアルバイト学生22名を雇い、力を合わせてコーパスの構築に力を注いで参りました。このコーパスのバージョン2公開を間近に控え、参加者の努力に心から感謝の意を表したいと存じます。我々は1つの任務を完成させました。今後、このテーマに関心を持つ研究者の皆様によって、このコーパスが利用され、台湾の学生の日本語習得や言語の成長が、音声、文字、諸々の文法事項、談話などの各項目にわたって研究され、そして皆様の研究成果を総合することによって、学習段階や日本語の進歩の原則などが明らかにされることを、心より願って止みません。

LARP at SCU コーパスの概要

本プロジェクトが収集している学習者言語資料は、作文資料と会話資料からなります。毎月1回、プロジェクトに参加している学習者に作文を書いてもらい、それを添削するためのフォローアップ・インタビューを行ない、それを受けて最初の作文を修正してもらいました。これを1年生の第2セメスターから4年生の卒業間際まで、夏期・冬期休暇を除き毎月行いました。

初級から上級にいたるまでの、11人の言葉の記録が、1か月という短かい間隔で収集されているところが、本コーパスのユニークな点です。

 

学習者

学習者は20039月に台湾の東呉大学日本語学科に入学した者の中から37名が参加しました。プロジェクトへの参加は全員が自発的で、報酬も受け取っていません。プロジェクトの内容に賛同し、自分の作文力あるいは会話力の向上のために参加しました。収集した資料のコーパス化は、学習者の許可を得て行っております。

 

対話者

作文にフィードバックを与える対話者は、台湾の高等教育に従事し、言語習得に関心を持つ台湾人と日本人の教師や、本学日本語文学系修士課程に所属する大学院生でした。本プロジェクトは東呉大学が中心でしたが、参加した対話者は本学だけではなく、他の大学の先生方も数多くご参加くださいました。

 

資料の内容

 

作文資料

作文資料は、与えられたテーマについて学習者が制限時間内に書いた「作文1」と、対話者からのフィードバックを受けて修正を加えた「作文2」があります。作文1は、1時間以内に、600字程度でまとめること、そして辞書などは参照しないことを指示しました。(作文のテーマは、本ページ末表1をご覧ください)

 作文資料は、以下の2種類の形式で提供されます。

·      学習者が原稿用紙に書いたものをスキャナーで複写したPDFファイル

·      およびそれをテキストファイルに転記したもの

 

なお、作文1の転記資料に関しては、スタッフによる転記ミスの確認・修正作業を行いましたが、作文2に関しては、作業に当たる人員の確保の問題から、それをしておりません。作文2を研究の資料としてお使いの場合には、スキャナー画像にてご確認くださいますようお願い申し上げます。

 

また、作文1の転記資料でも、テキストファイルで表現できない情報(例えば字形など)も多々あります。ご利用の際には、スキャナー画像でご確認くださいますようお願い申し上げます。

 

会話資料

1時間の作文の後、学習者と対話者が20分ほど会話をしました。これを録音し、転記したものが会話資料です。

会話資料ご使用についてのご注意

この資料は転記ミスの確認・修正作業を一切行っておりませんので、学習者の言葉を忠実に記録していない可能性があります。もし、言語資料として会話資料をご使用の場合には、別途配布される録音資料(会話の録音をMP3に変換したもの)で、内容をご確認の上ご使用ください。録音資料は東呉大学の教職員、学生、および本プロジェクトの関係者であれば誰でも申し込むことができます。

 

各回のテーマと参加人数、および資料の件数

各回の作文のテーマ、参加人数、およびそこで収集された資料の件数を表1に示します。

1 各回のテーマと参加人数、および各資料の件数

テーマ

参加人数

1

私の一日

35

2

春休み

37

3

私の部屋

37

4

私の夢

36

5

高校生活

36

6

忘れられない出来事

34

7

十年後の私

34

8

もし一千万元があたったら

34

9

大学生活に期待すること

33

10

私と日本語の出会い

33

11

お正月

31

12

携帯電話

31

13

母の日

31

14

友情

31

15

流行

31

16

夏休み

29

17

私の愛用品

28

18

旅する

28

19

選挙

28

20

2006年を迎えて

28

21

最近の出来事

28

22

スポーツ

27

23

町(街)

27

24

私の愛読書

27

25

最後の夏休み

27

26

台湾のデモについて

27

27

ゴミ問題

27

28

台湾の外食文化

26

29

コーヒー文化

26

30

野良犬の問題

26

31

少子化

26

32

大学生の恋愛観

26

33

LARPに参加した感想

26

 

次に、各資料の有無を表2に示します。資料は、欠損がなければ33件あります。33件より少ないものは、資料が紛失していることを意味します。

 

2 各資料の有無一覧

資料は欠損がなければ33件あります。

(*録音資料(MP3)は本学の教員・学生であれば誰でも利用できます。)

学習者

文字化テキスト

作文スキャン

録音(MP3)*

No.

作文1

会話

作文2

作文1

作文2

作文1

会話

作文2

1

32

33

31

32

31

33

33

27

2

15

15

15

15

15

15

15

10

3

5

5

5

5

5

4

4

0

4

26

26

27

26

27

25

25

18

5

33

33

33

33

33

32

32

27

6

33

33

32

33

32

31

33

24

7

23

21

22

23

22

21

21

15

8

33

26

33

33

33

25

25

21

9

33

22

31

33

31

20

21

17

10

33

32

32

33

32

32

32

23

11

10

10

10

10

10

10

10

5

12

31

26

27

31

25

24

24

24

13

16

16

16

16

16

15

16

9

14

33

30

32

33

32

25

25

21

15

32

33

33

32

33

31

31

25

16

30

30

30

30

30

30

30

24

17

5

5

5

5

5

5

5

0

18

30

27

27

30

25

23

22

17

19

25

25

25

25

25

25

25

18

20

33

25

31

33

31

24

24

18

21

33

30

33

33

33

28

29

23

22

9

7

9

9

9

7

7

5

23

15

15

15

15

15

15

15

10

24

33

33

30

33

30

33

33

26

25

33

33

33

33

33

26

26

19

26

33

33

32

33

32

31

32

25

27

33

33

33

33

33

32

32

26

28

33

33

33

33

33

30

30

19

29

33

33

33

32

33

33

33

32

30

33

33

33

33

33

33

33

26

31

32

32

32

32

32

30

30

14

32

8

7

7

7

7

7

7

1

33

21

19

20

20

13

8

8

4

34

33

31

33

33

33

31

29

24

35

33

33

33

33

33

32

33

28

36

2

1

2

2

2

1

1

0

37

32

32

32

32

32

19

29

21

 

LARPコーパス、配布お申込のご案内

データの利用条件

1. データのご利用は、研究目的に限ります。商用利用はできません。

2. ご利用に当たり、利用条件などを明記した誓約書をご提出ください。

3. データは無償でご利用いただけますが、DVDディスクの費用や郵送費用などの処理費用として台湾ドル300元の手数料をいただきます。日本からのお申込は、日本円で1,500円、その他の国からの場合はアメリカドルで15ドルをお振込ください。

4. データを利用して論文発表(口頭発表も含めて)をする場合、発表された論文の抜き刷りやコピーを一部ご提出ください。

5. また、データを利用した論文に、誓約書別紙にある「要記載事項」を明記していただきますよう、お願い申し上げます。

 

 

配布内容

 

内 容

1.収録資料のご紹介・学習者の背景資料

 

2.作文原稿のスキャン画像(PDF形式)

 

 作文1(初稿)、作文2(修正稿)

 

3.文字起しテキストデータ(utf-8によるテキスト形式)

 

 作文1 (LARPスタッフによる確認・修正済)

 

 作文2・会話 (確認作業はしていません)

価 格

NT$300.(日本円1,500円、アメリカドル$15.)

配布媒体

DVD-R 1

配布方法

郵送

 

データの申し込み方法

 

台湾内からのお申し込みの場合

誓約書をダウンロードして、必要事項を記入し署名したのち、手数料(台湾元で300)とともに、現金書留で以下の宛先に郵送してください。

 

111 台北市士林区臨渓路70
東呉大学日本語文学系 LARP at SCU  李宗禾 老師

Email: chensuc4@scu.edu.tw

日本からのお申し込みの場合

誓約書をダウンロードして、必要事項を記入し署名したのち、手数料1,500円の振込控えのコピー1部と一緒に、書留で以下の宛先に郵送してください。

 

111 台湾台北市士林区臨渓路70
東呉大学日本語文学系 LARP at SCU 李宗禾 老師
Email: chensuc4@scu.edu.tw


振込先の口座はこちらです。

 

名義人

陳 淑娟 (チン シュクケン)

銀行名

ゆうちょ銀行

金融機関コード

9900

店番

008

預金種目

普通

店名

〇〇八 店(ゼロゼロハチ店)

口座番号

2100455

 

(または10070-21004551)

 

その他の国からのお申し込みの場合

郵便振替にて手数料(アメリカドルで15ドル)をご送金いただき、振替の控えのコピー1部と、必要事項を記入し署名した誓約書を、書留で以下の宛先に郵送してください。

 

111 台湾台北市士林区臨渓路70
東呉大学日本語文学系 LARP at SCU 李宗禾 老師
Email: chensuc4@scu.edu.tw


郵便振替の口座番号はこちらです。

 

口座番号

700-0001864-0145551

口座名義

陳淑娟老師研究専戸

 

補足

1. 手数料は台湾ドル300元です。日本からの場合は日本円1,500円をゆうちょ銀行の指定口座にお振込いただき、その控えのコピーをお送りください。その他の地域の場合はアメリカドル15ドルを所定の口座にお振込ください。

2. 送付する内容物はテキストデータと作文原稿をスキャナーで撮影した画像データ、および学習者の背景情報です(DVD1枚)。

3. 録音資料(MP3)は東呉大学の教職員、学生、および本プロジェクトの関係者であれば誰でも申し込むことができます。直接担当者までお尋ねください。

お問い合わせ

 

郵便番号:111
住所:台湾 台北市士林區臨溪路70
東呉大学外語学院日本語文学系

陳 淑娟 教授
Email: chensuc4@scu.edu.tw

 

 

 

プロジェクトへの貢献者

 

本プロジェクトは以下の方々のご貢献によります。

 上条純恵  周巽祥  郭玟圻  江志欣  林怡秀
 小野亜規子  林仁惠  羅素娟  川瀨佐恵  林信伊
 山本紀代  蔡伶琴  李宗禾  馮寶珠  林雅玲
 王淑琴  劉怡伶  謝佳芸  菊川秀夫  張銀娥
 王薇婷  小口真希  林淑貞  蘇克保  莊麗麗
 江崎愛  中村直孝  潘嘉儀  李桂芳  郭侑旻
 何珮琳  方淑瑩  許孟蓉  王玉玲  陳琬霖
 李宜芃  呂兆萍  呉欣芳  魏艾玲  喬建仲
 林佩怡  呂智剛  前田純代  橫山麻紀  曾于芬
 後藤晃  李霙綺  八嶋康裕  有馬樹里  曾惠屏
 洪昭鳳  谷瑞恵  荒井智子  簡卉雯  程珮涵
 許夏珮  許佳璇  陳相州  吳佳詠  黃文怡
 陳冠伶  金惠芳  劉瑞傑  張淑靜  黃美琇
 陳淑娟  許紹偉  赤津妃映  陳忻怡  楊慧琦
 松倉朋子  許富姚  遠藤保代  中川仁  詹淑媛
 陳麗貞  陳怡萍  朱順  堀越和男  詹惠雯
 富田真菜  游喬嵐  平田鉄太郎  陳惠怡  劉又慈
 彭心盈  黄士哲  鄭凱昇  林玉英  劉欣瑜
 塩入澄  楊幸穎  呉傳賢  河村美智子  劉燕龍
 楊千嬅  詹曉玲  大久保由希  王玟釧  蔣官臻
 楊世昌  廖文玲  游韋倫  王家萍  蕭令宜
 蔡孟達  劉碧惠  小林由紀  王笛筠  鍾蕙如
 盧月珠  賴思蓉  李昱佩  王婷慧  余秋芸
 羅文媛  關口剛司  佐藤健太郎  吳尚臻  馬信成
 羅濟立  羅怡菁  宮川瑠美  李佳穎  許馨儀
 藤原徹  林雅惠  周美鵑  李若洵  郭璟倩
 佐伯真代  木下謙朗  吉倉麻利  林宜佳  黃凱
 黃倩玫  李曉雯  川合理恵  林宛臻  楊舒婷

 

 

|回到頁首 |