社団人 電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, TECHNICAL REPORT OF IEICE INFORMATION AND COMMUNICATION ENGINEERS Web への向上目的とした難語の平化 中野子 遠藤 菅原昌平 1 乾健太郎 2 藤田篤 3 1: 株式会社 NTT  〒104-0033 京都中央区新川 1-21-2 2: 奈良先端科学技術大学院大学 〒630-0101 奈良県生駒市高山町 8916-5 3: 京都大学 情報科学研究所 〒606-8501 京都市左京区吉田町 E-mail: nakanot@nttdata.co.jp, endouat@nttdata.co.jp, sugawaras@nttdata.co.jp, inui@is.naist.jp, fujita@pine.kuee.kyoto-u.ac.jp あまし Webに含ま情報は,利用者の知識や閲覧環境,学習経歴などにって分かやす さが異な.特に,高齢者や障害者などの情報弱者にとってこの問題は刻であ.稿では,問題の一つであ 難語取上げ,言い換え技術用いてWeb上の難語の自動変換す実験について報告す.対象 限定すば,現在の資源技術のにって言い換えの正確性と網羅性あ程度確保でき 見通し得た.  ,,難語,言い換え Lexical Paraphrasing for Improving Accessibility to the Web Tomoko NAKANO 1 Atsushi ENDO 1 Shohei SUGAWARA 1 Kentaro INUI 2 Atsushi FUJITA 3 1: NTTDATA Corporation 21-2,Shinkawa 1-chome, Chuo-ku, Tokyo, 104-0033, Japan 2: Nara Institute of Science and Technology 8916-5, Takayama-cho, Ikoma-city, Nara, 630-0101, Japan 3: Graduate School of Informatics, Kyoto University Yoshida-Honmachi, Sakyo-ku, Kyoto, 606-8501, Japan E-mail: nakanot@nttdata.co.jp, endouat@nttdata.co.jp, sugawaras@nttdata.co.jp, inui@is.naist.jp, fujita@pine.kuee.kyoto-u.ac.jp Abstract Textual information included in Web pages is not equally accessible to users dependingfor exampleon their language proficiency and browsing methods. This paper reports on the preliminary results of our experiment on the task of automatically simplifying unfamiliar words in Web documents. In the experiment, we aim at examining present techniques for automatic lexical paraphrasing to our task and are obtaining promising results indicating our approach would work as far as the target domain is carefully restricted. Keyword The Internet, Accessibility, Difficult/unfamiliar words, Paraphrasing 1. はじめに 近年の情報処理技術( IT )の進歩は,生者の情報 入手に大きな変化もたした.しかし,障害等に ってこの恩恵十分に享受できない人々は,い 情報弱者として情報の通かますます疎外さ傾 向にあ.例えば,視覚障害者が読み上げ使 う場合,元に読み上げ想定した配慮が施さ ていないと,内容が理解できない場合があ.また, 聴覚障害者の中には,幼少の日語学習が困難であ ったため,文章読むことに不自由感じてい人が 少なくない. こうした Web 上の情報の 向上させためには,どのうな要因で の読解が困難になのか分析し,その問題ひとつ ひとつ解決す必要があ. 稿では,情報の分かにくさ解す 方として,中の難解な言語表現平な表 現に自動変換す技術取上げ,Web への適 用の効性について検証し,実用化への課題について 報告す.