社団人 電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, TECHNICAL REPORT OF IEICE INFORMATION AND COMMUNICATION ENGINEERS Web への向上目的とした難語の平化 中野子 1 遠藤 1 菅原昌平 1 乾健太郎 2 藤田篤 3 1: 株式会社 NTT 〒104-0033 京都中央区新川 1-21-2 2: 奈良先端科学技術大学院大学 〒630-0101 奈良県生駒市高山町 8916-5 3: 京都大学 情報科学研究所 〒606-8501 京都市左京区吉田町 E-mail: nakanot@nttdata.co.jp, endouat@nttdata.co.jp, sugawaras@nttdata.co.jp, inui@is.naist.jp, fujita@pine.kuee.kyoto-u.ac.jp あまし Webに含ま情報は,利用者の知識や閲覧環境,学習経歴などにって分かやす さが異な.特に,高齢者や障害者などの情報弱者にとってこの問題は刻であ.稿では,問題の一つであ “難語”取上げ,言い換え技術用いてWeb上の難語の自動変換す実験について報告す.対象 限定すば,現在の資源技術のにって言い換えの正確性と網羅性あ程度確保でき 見通し得た. ,,難語,言い換え Lexical Paraphrasing for Improving Accessibility to the Web Tomoko NAKANO 1 Atsushi ENDO 1 Shohei SUGAWARA 1 Kentaro INUI 2 Atsushi FUJITA 3 1: NTTDATA Corporation 21-2,Shinkawa 1-chome, Chuo-ku, Tokyo, 104-0033, Japan 2: Nara Institute of Science and Technology 8916-5, Takayama-cho, Ikoma-city, Nara, 630-0101, Japan 3: Graduate School of Informatics, Kyoto University Yoshida-Honmachi, Sakyo-ku, Kyoto, 606-8501, Japan E-mail: nakanot@nttdata.co.jp, endouat@nttdata.co.jp, sugawaras@nttdata.co.jp, inui@is.naist.jp, fujita@pine.kuee.kyoto-u.ac.jp Abstract Textual information included in Web pages is not equally accessible to users depending, for example, on their language proficiency and browsing methods. This paper reports on the preliminary results of our experiment on the task of automatically simplifying unfamiliar words in Web documents. In the experiment, we aim at examining present techniques for automatic lexical paraphrasing to our task and are obtaining promising results indicating our approach would work as far as the target domain is carefully restricted. Keyword The Internet, Accessibility, Difficult/unfamiliar words, Paraphrasing 1. はじめに 近年の情報処理技術( IT )の進歩は,生者の情報 入手に大きな変化もたした.しかし,障害等に ってこの恩恵十分に享受できない人々は,い 情報弱者として情報の通かますます疎外さ傾 向にあ.例えば,視覚障害者が読み上げ使 う場合,元に読み上げ想定した配慮が施さ ていないと,内容が理解できない場合があ.また, 聴覚障害者の中には,幼少の日語学習が困難であ ったため,文章読むことに不自由感じてい人が 少なくない. こうした Web 上の情報の 向上させためには,どのうな要因で の読解が困難になのか分析し,その問題ひとつ ひとつ解決す必要があ. 稿では,情報の分かにくさ解す 方として,中の難解な言語表現平な表 現に自動変換す技術取上げ,Web への適 用の効性について検証し,実用化への課題について 報告す.