ウダ リュウヤ
宇田 隆哉 所属 コンピュータサイエンス学部 コンピュータサイエンス学科 職種 准教授 |
|
言語種別 | 日本語 |
発行・発表の年月 | 2023/02 |
形態種別 | 学術講演予稿集(学会、研究会を含む) |
標題 | 電子メール本文のベクトル化による本人確認手法 |
執筆形態 | 共著 |
掲載誌名 | 情報処理学会研究報告 |
掲載区分 | 国内 |
出版社・発行元 | 情報処理学会 |
巻・号・頁 | 2023-CSEC-100(40),1-5頁 |
総ページ数 | 5 |
担当区分 | 最終著者 |
著者・共著者 | 下里賢司, 望月郁弥, 行田早希, 小林亮, 山田悠人, 西村彩夏, 宇田隆哉 |
概要 | 我々が日々受信するEmailの中には不適切なものが常に含まれている.既存のメールフィルタシステムでは,本文中に添付されているURLやアドレスを基に適切であるかどうか判別しているものがある.しかし,不正アクセスによってメールアドレスが奪われ,第三者からなりすましのメールを送られた場合には対応できない.そこで,本研究では,単語の分散表現と分布仮説を組み合わせた機械学習システムを用いて,英語で記述された電子メールの本文から特徴の抽出を試みた.メール本文の前処理として,メールのアカウント所持者から送信されたメール群となりすましメール群をそれぞれWord2Vecを用いて単語ごとにベクトル化し,機械学習を行った.機械学習アルゴリズムにはCNN,SVM,RFをそれぞれ用い,本人かそうでないかの2値分類を行った.分類の結果,Scoreは,CNNが0.758,SVMが0.834,RFが0.844となった.今回の実験では,1名あたり100件,合計3,000件のメールしか扱っていないため精度がこの程度となったが,データ量を増やせば,なりすましメール対策用のメールフィルタシステムを構築できる可能性はある. |