Author
Affiliation

苅谷千尋

金沢大学 教育支援センター

Published

Wed, 12, Jun, 2024

Modified

Thu, 30, Apr, 2026

随時更新します

以下のサイトは有益ですが、今となっては古い情報も交じっています。まずは指定の教科書をしっかりと理解することから始めましょう。いずれ教科書も古くなりますが、教科書内においては、相互に矛盾する記述はないため、理解しやすいです。

生成AI

  • 公式生成AI

    すべてのユーザーは、Posit AI の無料トライアルにアクセスでき、Posit Assistant とのやり取り回数に上限が設定されています。トライアル終了後、継続利用には有料サブスクリプションが必要です。サブスクリプションには、インタラクションの上限が高く設定されており、必要に応じてユーザーは追加の利用クレジットを購入できます。

0. 教科書

Ⅰ. 基本

1から5までの基本的な内容は、この授業内で理解して欲しい範囲です(3の⑸と⑹は除く)

1. 全般

2. 初学者

3. ggplot

⑴ ggplot

⑵ アノテーション

⑶ カラーパレット

⑷ テーマ

⑸ ラッパー

⑹アニメーション

4. テーブル

5. 出力方法

⑴ 総論

⑵ pdf

⑶ ウェブサイト

⑷ ダッシュボード

6. マップ

7. コミュニティ

8. API

9. インストール他

Ⅱ. 研究分野別

1. 社会科学

⑴ 政治学

  • legislatoR
    • 世界各国の議員に関する標準化データベース
  • ggparliament
    • 議席構成や投票結果の可視化
  • congress
    • アメリカ連邦議会(Congress.gov API)が提供しているデータをプログラム的に取得できるインターフェースへのインターフェイス
  • ggredist
    • アメリカの政治地図作成のためのggplot2拡張機能

⑵ 経済学

2. 医学・生物学

3. 心理学

4. 自然科学

5. スポーツ

この他、専門分野ごとに多くの専門書が出版されています

Ⅲ. 分析手法

1. ネットワーク分析

2. テキストマイニング

  • quanteda
    • 自然言語処理(テキスト分析)全般に対応する総合ツール。大量の文章データを扱いやすい形に整理(コーパス作成、トークン化、特徴量行列化など)することで、高速かつ効率的な計算が可能。文書全体の統計や複雑な分析に向く
  • tidytext
    • 「tidy(整然とした)」データフレーム形式でテキストを扱うことに特化。文章 → 単語のリスト(tidy形式)に変換して、dplyrやggplot2などtidyverseと組み合わせて分析可能。少量のデータや可視化・集計が中心の場合に便利
  • gibasa
    • 日本語を含むCJK(Chinese, Japanese, Korean)文字列の形態素解析を目的とするパッケージ。日本語に強い形態素解析器MeCabをRから使えるようにラップしたRcppライブラリとして提供される。解析結果はtidytextやquantedaに渡して、統計解析や特徴量抽出に利用することが可能

3. コレスポンデンス分析

4. クラスター分析

Hierarchical Clustering(公式サイト)

  • ANOVA(分析分散法):pwranova
    • ANOVAデザインにおける検出力解析を行うためのパッケージ。任意の因子数に対して、主効果および交互作用効果を完全サポート
  • ネットワーク分析:ggraphh
    • ネットワーク・関係データの解析・可視化
  • 時系列分析:forecast
    • 経済・環境データの予測・解析

Ⅳ. データ入手

1. 日本政府統計の総合窓口(e-stat)

Ⅴ. 前処理(データ加工)

1. 前処理全般

2. 時間処理

3. 同一処理

Ⅵ モデル

Ⅶ. データセット

Ⅸ. アカデミックなTips

Ⅹ. Quarto

テンプレート

  • Christopher T. Kenny, Quarto Extensions
    • APSRやOxford University Press Articleなど、各種ジャーナルのテンプレートが用意されています

機能拡張

  • Quarto Extensions
    • ポインターやQRコード生成など、多くのExtensionが紹介されいています