- 日 時
- 2019年9月3日(火)
- テーマA:
- 14時15分~17時15分
- テーマB:
- 17時30分~20時30分
以下注意点を記載します。
- どちらか一方のみの参加も,両方参加することも可能です。
- 早期申し込みに「限り」,両方参加時のセット割引があります。
- 参加費の詳細は大会開催要項をご覧ください。
- 両テーマとも定員などは設けていません。ただし,教室のキャパシティ(約100人)を超えた場合はその限りではありません。
テーマA:
- タイトル:
- Rにおけるtidyなデータ処理と効率的な分析ルーティン ―テキストマイングでの応用例―
- 講 師:
- 石田基広 先生(徳島大学)
- 概 要:
- 最近 R 界隈では tidyverse という分析フレームワークが浸透しています。tidyverseでは、データの前処理と分析方法を統一的な原理にもとづき一般化しようとしていると言えます。
本チュートリアルでは、この原理にならって、改めて Rにおけるデータ処理と分析の手順を確認します。同時に、機械学習周りの手法について、テキスト分析を事例に紹介します。 チュートリアル前半では、R でデータを操作するコツ(データの読み込みや tidyなデータ処理など)を解説します。またRの代表的なグラフィックス技法であるggplot2について説明します。
後半ではテキスト分析を例に、機械学習における分析ルーティンを紹介します。例えば、トピックモデルや単語分散表現にもとづく分類や予測、センチメント分析などを取り上げます。
なおパソコンを持参される受講者向けに、データや分析スクリプトを用意します。ただし、パソコンの持ち込みは必須ではなく、前半後半ともに座学として聴講するだけでも構いません。
テーマB:
- タイトル:
- 欠測データの統計解析
- 講 師:
- 高井啓二 先生(関西大学)
- 概 要:
- 本来観測されるはずが、その一部が観測されなかったデータを欠測データと言う。本チュートリアルでは、欠測データ解析の基礎的な概念や手法を紹介する。正規分布などの簡単だが重要な(数値)例を用いて、欠測データ解析の手法が何を目指しているのか、何をしているのか、という点についての理解を深めたい。