随時更新します
以下のサイトは有益ですが、今となっては古い情報も交じっています。まずは指定の教科書をしっかりと理解することから始めましょう。いずれ教科書も古くなりますが、教科書内においては、相互に矛盾する記述はないため、理解しやすいです。
生成AI
- 公式生成AI
- tidyverse AI(無料)
- POSIT AI(サブスクリプションサービス)
すべてのユーザーは、Posit AI の無料トライアルにアクセスでき、Posit Assistant とのやり取り回数に上限が設定されています。トライアル終了後、継続利用には有料サブスクリプションが必要です。サブスクリプションには、インタラクションの上限が高く設定されており、必要に応じてユーザーは追加の利用クレジットを購入できます。
0. 教科書
Ⅰ. 基本
1から5までの基本的な内容は、この授業内で理解して欲しい範囲です(3の⑸と⑹は除く)
1. 全般
2. 初学者
- R初学者のためのtidyverse100本ノック
- R初学者からよく質問されること
- RLadiesSydney, The RYouWithMe
- 世界的にも評価の高いR初学者向け教材です。動画が多く、わかりやすい
- R Studio: Beginners
- Allison Horst
3. ggplot
⑴ ggplot
⑵ アノテーション
⑶ カラーパレット
⑷ テーマ
⑸ ラッパー
⑹アニメーション
4. テーブル
5. 出力方法
⑴ 総論
⑵ pdf
⑶ ウェブサイト
⑷ ダッシュボード
- How to create a dashboard using Quarto
- Welcome to the Shiny Gallery!
- R Shiny Dashboard Portfolio Project | 1973 USArrests Dashboard | R Shiny Tutorial for Beginners
- How the “Clusterbuster” Shiny App Helps Hundreds of Doctors and Epidemiologists Battle COVID-19 in the Netherlands
- Our Big Mac index shows how burger prices differ across borders
6. マップ
7. コミュニティ
8. API
9. インストール他
Ⅱ. 研究分野別
1. 社会科学
⑴ 政治学
- legislatoR
- 世界各国の議員に関する標準化データベース
- ggparliament
- 議席構成や投票結果の可視化
- congress
- アメリカ連邦議会(Congress.gov API)が提供しているデータをプログラム的に取得できるインターフェースへのインターフェイス
- ggredist
- アメリカの政治地図作成のためのggplot2拡張機能
⑵ 経済学
- tidyquant
- 株価データや金融指標の分析、時系列処理
- BIS: Programmatic Access to Bank for International Settlements Data
- Bank for International Settlements (BIS) が公開している統計データをプログラム的に取得できるインターフェース
- BOJ: Interface to Bank of Japan Statistics
- 日本銀行が公開している統計データをプログラム的に取得できるインターフェース
2. 医学・生物学
- 疫学や公衆衛生に関わる業務のためのR
- 医学統計でよく使うRパッケージ
- Rtigraphではじめる生物ネットワーク解析
- 【RNA-seq】RNA-seq解析を徹底的に解説!Part2発現変動解析(DEG解析)
- Bioconductor — Genomicデータ解析ツール群
- Qiime2とRを用いて菌叢の機能予測をする
- Interfacing Seurat with the R tidy universe
- Introduction to ‘gggenes’
- Prevelence of SARS-CoV-2 Variants of Concern in Aoteoroa New Zealand
- survival
- 生存解析、カプラン・マイヤー曲線の描画
- tern
- 臨床試験報告表
- RJafroc
- 放射線画像(X線、CT、MRIなど) の読影能力の評価・解析
- jpinfect
- 日本での感染性疾患データの取得と処理のためのツール
- Bioconductor
- 遺伝子・ゲノム・トランスクリプトームなどのバイオデータの解析
- GenomicRanges
- Bioconductorの基盤パッケージ。ゲノム領域の計算・操作を行う
- gggenes
- 遺伝子・オペロン構造の可視化(ggplot2ベース)
3. 心理学
- psych
- 心理尺度の分析、因子分析、信頼性分析
- psychTools
- psychの補助ツール
- psyinfr
- 心理学のインフラツールとなることを目的としたRパッケージ
- 無料統計ソフトRで心理学
- 心理統計Rワークショップ・杉本海里
- 山田剛史編著『Rによる心理学研究法入門』
- 心理学用パッケージpsych: Procedures for Psychological, Psychometric, and Personality Research
4. 自然科学
5. スポーツ
この他、専門分野ごとに多くの専門書が出版されています
Ⅲ. 分析手法
1. ネットワーク分析
2. テキストマイニング
- quanteda
- 自然言語処理(テキスト分析)全般に対応する総合ツール。大量の文章データを扱いやすい形に整理(コーパス作成、トークン化、特徴量行列化など)することで、高速かつ効率的な計算が可能。文書全体の統計や複雑な分析に向く
- tidytext
- 「tidy(整然とした)」データフレーム形式でテキストを扱うことに特化。文章 → 単語のリスト(tidy形式)に変換して、dplyrやggplot2などtidyverseと組み合わせて分析可能。少量のデータや可視化・集計が中心の場合に便利
- gibasa
- 日本語を含むCJK(Chinese, Japanese, Korean)文字列の形態素解析を目的とするパッケージ。日本語に強い形態素解析器MeCabをRから使えるようにラップしたRcppライブラリとして提供される。解析結果はtidytextやquantedaに渡して、統計解析や特徴量抽出に利用することが可能
3. コレスポンデンス分析
4. クラスター分析
Ⅳ. データ入手
1. 日本政府統計の総合窓口(e-stat)
Ⅴ. 前処理(データ加工)
1. 前処理全般
2. 時間処理
3. 同一処理
Ⅵ モデル
Ⅶ. データセット
Ⅸ. アカデミックなTips
- Kazuharu Yanagimoto, 研究周り(特に経済学)で役に立つツール
- 研究者を前提とするTipsです(レベル的に中級程度)。特に以下が重要
- Rで論文を書く実践的なテクニック集 (プロジェクト・クリーニング編)
- Rで論文を書く実践的なテクニック集 (テーブル編)
- Rで論文を書く実践的なテクニック集 (グラフ編)
- これらのTipsだけでなく、Typstなどの新しい技術の活用例(パッケージの開発も含む)も、とても参考になります
Ⅹ. Quarto
テンプレート
- Christopher T. Kenny, Quarto Extensions
- APSRやOxford University Press Articleなど、各種ジャーナルのテンプレートが用意されています
機能拡張
- Quarto Extensions
- ポインターやQRコード生成など、多くのExtensionが紹介されいています
Copyright
CHIHIRO KARIYA 2026