新技術とデータ活用

ITパスポート試験対策

AIと機械学習

AI（Artificial Intelligence: 人工知能） とは、人間の知的活動（認識・判断・学習・推論など）をコンピュータに実行させる技術です。AIの研究は1950年代に始まり、これまでに3回のブームを経験しています。

時期	ブーム	主な技術
1950〜60年代	第1次AIブーム	探索・推論（パズルやゲーム）
1980年代	第2次AIブーム	エキスパートシステム（知識ベース）
2010年代〜	第3次AIブーム	機械学習・ディープラーニング

現在のAIは 特化型AI（弱いAI） と呼ばれ、画像認識や自然言語処理など特定のタスクに特化しています。例えば将棋AI「Ponanza」は将棋では人間を超える実力を持ちますが、チェスをプレイしたり、文章を書いたりすることはできません。人間のようにあらゆる知的タスクをこなせる 汎用AI（強いAI） はまだ実現していません。

機械学習（Machine Learning） は、大量のデータからパターンやルールを自動的に学習するAIの手法です。プログラマが明示的にルールを記述するのではなく、データを基にコンピュータ自身がルールを見つけ出します。

学習方法	説明	用途例
教師あり学習	正解ラベル付きのデータで学習	画像分類、スパム判定、売上予測
教師なし学習	正解ラベルなしでデータの構造を発見	クラスタリング（顧客分類）、異常検知
強化学習	試行錯誤を通じて報酬を最大化する行動を学習	ゲームAI、自動運転、ロボット制御

機械学習で重要な概念が 過学習（overfitting） です。訓練データに特化しすぎて、未知のデータに対する予測精度が低下する現象を指します。例えば、試験の過去問だけを丸暗記して応用問題が解けない状態に似ています。対策としては、データを訓練用とテスト用に分けて評価する、正則化やドロップアウトなどの手法で過度な学習を抑制する、といった方法があります。

ディープラーニング（深層学習） は、人間の脳の神経回路を模した ニューラルネットワーク を多層に重ねた機械学習の手法です。画像認識・音声認識・自然言語処理で飛躍的な成果を上げています。

モデル	正式名称	特徴
CNN	Convolutional Neural Network	画像認識に特化。畳み込み処理で画像の特徴を抽出
RNN	Recurrent Neural Network	時系列データに特化。過去の情報を保持して処理
Transformer	—	自然言語処理に革新。文脈の関連性を並列処理で把握

生成AI（Generative AI） は、テキスト・画像・音声・動画などのコンテンツを生成するAIです。代表的な技術として LLM（Large Language Model: 大規模言語モデル） があり、GPTシリーズなどが知られています。生成AIは業務効率化やクリエイティブ分野で革新をもたらしていますが、ハルシネーション（事実と異なる情報の生成）や著作権の問題も課題です。特に、学習データに著作物が含まれる場合の権利処理は国際的に議論が続いており、法的な枠組みの整備が進められています。

AIの普及に伴い、AI倫理 も重要なテーマとなっています。

課題	説明
公平性	AIが特定の属性（性別・人種等）に対して差別的な判断をしないこと
透明性	AIの判断根拠を人間が理解・説明できること（説明可能なAI: XAI）
プライバシー	学習データに含まれる個人情報の適切な管理
責任の所在	AIが誤った判断をした場合の責任の帰属
ハルシネーション	生成AIが事実と異なる情報を生成する問題

日本では「AI戦略」や「AI事業者ガイドライン」が策定され、AI利活用における原則（人間中心、安全性、公平性、透明性など）が示されています。

ポイント

AIの3分類: 教師あり学習（分類・予測）、教師なし学習（クラスタリング）、強化学習（試行錯誤）。過学習 = 訓練データに特化しすぎて汎化性能が低下する現象。対策はデータ分割・正則化等。ディープラーニングではCNN（画像）、RNN（時系列）、Transformer（言語）が主要モデル。AI倫理（公平性・透明性・プライバシー）と生成AIの著作権問題にも注意。

用語

AI（人工知能）: 人間の知的活動をコンピュータに実行させる技術の総称
機械学習: 大量のデータからパターンやルールを自動的に学習するAIの手法
ディープラーニング: 多層のニューラルネットワークを用いた機械学習。画像認識等で高い精度を実現
教師あり学習: 正解ラベル付きデータで学習する方法。分類・予測に使用
生成AI: テキスト・画像等のコンテンツを新たに生成するAI。LLMが代表例
ハルシネーション: 生成AIが事実と異なる情報をもっともらしく出力する現象
過学習: 訓練データに特化しすぎて未知データへの予測精度が低下する現象。overfittingとも呼ぶ

IoTとエッジコンピューティング

IoT（Internet of Things: モノのインターネット） とは、家電・自動車・センサなど、あらゆる「モノ」がインターネットに接続され、データの収集・送受信を行う仕組みです。

IoTのアーキテクチャは、デバイス層からアプリケーション層まで4つの層で構成されます。

層	役割	具体例
デバイス層	センサやアクチュエータでデータを収集・操作	温度センサ、カメラ、モーター
ネットワーク層	データをクラウドや他のデバイスに転送	Wi-Fi、Bluetooth、LPWA、5G
プラットフォーム層	データの蓄積・処理・分析	クラウドサーバ、データベース
アプリケーション層	分析結果を基にサービスを提供	ダッシュボード、自動制御

IoTで使用される センサ技術 は多岐にわたります。

センサ種類	計測対象	活用例
温度・湿度センサ	気温・湿度	空調管理、農業ハウス
加速度センサ	加速度・傾き	スマートフォンの画面回転、歩数計
GPSセンサ	位置情報	カーナビ、物流追跡
光センサ	光の強さ	自動照明、カメラの露出調整
圧力センサ	圧力・重さ	体重計、タイヤ空気圧監視
ジャイロセンサ	回転角速度	ドローンの姿勢制御、VR

IoT向けの通信技術として LPWA（Low Power Wide Area） があります。低消費電力で広範囲をカバーする無線通信技術で、センサデータの送信に適しています。代表的な規格にはLoRaWAN、Sigfoxがあります。

IoTによって大量のデータが生成されるようになり、すべてのデータをクラウドに送って処理すると通信遅延やコストの問題が発生します。そこで注目されているのが エッジコンピューティング です。

方式	処理場所	応答速度	適する用途
エッジコンピューティング	デバイスの近く	ミリ秒レベル	自動運転、ロボット手術
フォグコンピューティング	エッジとクラウドの中間（ゲートウェイ等）	秒レベル	データの前処理・フィルタリング
クラウドコンピューティング	中央データセンター	秒〜分レベル	大規模データ分析・長期保存

この3層は対立するものではなく、組み合わせて使います。エッジで即時判断が必要な処理を行い、フォグで中間的な集約・前処理を行い、クラウドで大規模な蓄積・分析を行うという役割分担です。

IoTの発展に関連する先進技術も押さえておきましょう。

デジタルツイン は、現実世界の物体やシステムをデジタル空間上に再現する技術です。工場の設備をデジタルツインで再現し、シミュレーションにより最適な運用を検討するといった活用がされています。

5G（第5世代移動通信システム） は、IoT時代の通信基盤として期待される次世代通信規格です。4Gとの比較で性能差を確認しましょう。

項目	4G（LTE）	5G
最大通信速度	約1Gbps	最大20Gbps（約20倍）
遅延	約10ms	1ms以下（約1/10）
同時接続数	約10万台/km²	約100万台/km²（約10倍）

5Gの超低遅延（1ms以下）は、自動運転やリモート手術のように「一瞬の遅れが命に関わる」場面で不可欠です。多数同時接続は、スマートシティにおける大量のIoTセンサの運用を可能にします。

CPS（Cyber-Physical System） は、現実世界のデータをサイバー空間で分析し、その結果を現実世界にフィードバックする仕組みです。IoTでデータを収集し、AIで分析し、現実世界の制御に反映するという循環がCPSの基本的な流れです。

CPSとデジタルツインの関係を整理すると、CPSは「サイバー空間と物理空間を統合する」という 広い概念 であり、デジタルツインはCPSを実現する 具体的な手段の一つ です。デジタルツインで物理世界の「双子（ツイン）」をサイバー空間に構築し、シミュレーションや最適化を行います。

Society 5.0 はCPSを基盤とした超スマート社会のビジョンとして日本政府が提唱しています。

ポイント

IoTはあらゆるモノをインターネットに接続する仕組みで、センサ技術とLPWA通信が基盤となる。エッジコンピューティングはデバイス近くでのリアルタイム処理を実現する。5Gは高速・低遅延・多数同時接続が特徴で、IoT基盤として重要。デジタルツインやCPSが現実世界とサイバー空間を連携させる。

用語

IoT: Internet of Things。あらゆるモノがインターネットに接続される仕組み
エッジコンピューティング: デバイスの近くでデータを処理する方式。低遅延が特徴
フォグコンピューティング: エッジとクラウドの中間層でデータ処理を行う方式
デジタルツイン: 現実世界の物体やシステムをデジタル空間上に再現する技術
5G: 第5世代移動通信。高速大容量・超低遅延・多数同時接続が特徴
LPWA: Low Power Wide Area。低消費電力・広範囲の無線通信技術
CPS: Cyber-Physical System。現実世界のデータをサイバー空間で分析しフィードバックする仕組み

クラウドサービス

クラウドコンピューティング とは、インターネットを通じてサーバ・ストレージ・ソフトウェアなどのITリソースを必要な分だけ利用できるサービスモデルです。自社で物理的なサーバを保有・管理する必要がなく、初期コストの削減とスケーラビリティ（拡張性）の向上が大きなメリットです。

クラウドサービスは提供する範囲に応じて3つのモデルに分類されます。

モデル	正式名称	提供範囲	利用者の管理範囲	代表例
IaaS	Infrastructure as a Service	仮想サーバ、ネットワーク、ストレージ	OS、ミドルウェア、アプリ	AWS EC2, Azure VM
PaaS	Platform as a Service	IaaS + OS、ミドルウェア、開発環境	アプリケーションのみ	Heroku, Google App Engine
SaaS	Software as a Service	すべて（完成したソフトウェア）	設定・データのみ	Gmail, Microsoft 365, Slack

クラウドサービスの責任分界

IaaS → PaaS → SaaS の順に、クラウド事業者が管理する範囲が広がり、利用者の管理負担は軽くなります。その代わり、利用者のカスタマイズ自由度は下がります。

選択の基準: すぐに使いたい → SaaS（例: Gmail）。独自アプリを開発したいがインフラ管理は不要 → PaaS（例: Heroku）。インフラから自由に構築したい → IaaS（例: AWS EC2）。右に行くほど自由度が高い反面、運用負担も大きくなります。

クラウドの デプロイメントモデル も重要です。

モデル	説明	メリット	デメリット
パブリッククラウド	クラウド事業者が不特定多数に提供	低コスト、即時利用可能	セキュリティ管理が事業者依存
プライベートクラウド	自社専用のクラウド環境を構築	セキュリティ制御が容易	コストが高い
ハイブリッドクラウド	パブリックとプライベートを組み合わせ	柔軟性とセキュリティのバランス	運用が複雑
マルチクラウド	複数のパブリッククラウドを併用	ベンダーロックイン回避	運用・管理の複雑化

近年のクラウド関連技術として、以下も押さえておきましょう。

サーバレス は、サーバの管理をクラウド事業者に任せ、開発者はコードの記述に集中できるアーキテクチャです。実行時間に応じた従量課金で、アクセスがない時はコストがかかりません。AWS LambdaやGoogle Cloud Functionsが代表例です。

コンテナ は、アプリケーションとその実行環境を一つのパッケージにまとめる技術です。仮想マシンよりも軽量で起動が高速です。

技術	説明
コンテナ	アプリと依存環境をパッケージ化。Docker が代表的なコンテナ技術
コンテナオーケストレーション	多数のコンテナの配置・管理を自動化。Kubernetes が代表
マイクロサービス	アプリケーションを小さな独立したサービスに分割する設計手法
モノリシック	アプリケーション全体を一つの単位として構築する従来の設計手法

マイクロサービスアーキテクチャ は、大きなアプリケーションを小さなサービスに分割し、それぞれを独立して開発・デプロイ・スケーリングできる設計手法です。コンテナ技術と組み合わせて利用されることが多く、クラウドネイティブなシステム開発の主流となっています。対になる概念として、アプリケーション全体を一体で構築する モノリシックアーキテクチャ があります。

ポイント

クラウド: SaaS（すぐ利用）> PaaS（アプリ開発）> IaaS（インフラ構築）。右へ行くほど自由度が高く運用負担も大きい。デプロイメントモデルにはパブリック・プライベート・ハイブリッドがある。サーバレスはサーバ管理不要で従量課金、コンテナはアプリと環境のパッケージ化（Docker）、マイクロサービスはアプリを独立した小サービスに分割する設計手法。

用語

IaaS: Infrastructure as a Service。仮想サーバ等のインフラをクラウドで提供
PaaS: Platform as a Service。開発プラットフォームをクラウドで提供
SaaS: Software as a Service。完成したソフトウェアをクラウドで提供
サーバレス: サーバ管理が不要なクラウドアーキテクチャ。従量課金で実行
コンテナ: アプリと実行環境をパッケージ化する技術。Dockerが代表
マイクロサービス: アプリを独立した小さなサービスに分割する設計手法
ハイブリッドクラウド: パブリックとプライベートクラウドを組み合わせた利用形態

ビッグデータとデータサイエンス

ビッグデータ とは、従来のデータベース管理ツールでは処理が困難な、大量かつ多様なデータの集合を指します。ビッグデータの特徴は 3V（または5V）で表されます。

特徴	英語	説明
Volume	量	テラバイト〜ペタバイト級の大量データ
Velocity	速度	リアルタイムに高速で生成・処理されるデータ
Variety	多様性	テキスト・画像・動画・センサデータなど多様な形式
Veracity	正確性	データの信頼性と品質の確保（5V拡張）
Value	価値	データから有用な知見を引き出せること（5V拡張）

ビッグデータの具体例には、SNSの投稿データ、ECサイトの購買履歴、IoTセンサの計測データ、GPS位置情報、Webアクセスログなどがあります。

ビッグデータを活用するためのデータ基盤技術を整理します。

技術	説明
データウェアハウス（DWH）	業務システムから集めたデータを分析用に整理・蓄積する専用データベース。構造化データが中心
データレイク	構造化・非構造化を問わず、あらゆるデータを元の形式のまま蓄積する大規模ストレージ
データマート	DWHから特定の部門や目的に必要なデータだけを抽出したサブセット
ETL	Extract（抽出）、Transform（変換）、Load（格納）。データソースからDWH/データレイクへのデータ連携処理

データウェアハウス は整理された構造化データを分析するのに適し、データレイク は生データを大量にためておいて後から分析するのに適しています。

データマイニング は、大量のデータから統計学やAI技術を使って有用なパターンやルールを発見する手法です。

手法	説明	例
相関分析	データ間の関連性を発見	「ビールを買う人はおむつも買う傾向がある」
クラスタ分析	類似したデータをグループに分類	顧客セグメンテーション
回帰分析	ある変数から別の変数の値を予測	売上予測
決定木分析	条件分岐でデータを分類するルールを導出	解約リスクの判定
テキストマイニング	文章データから有用な情報を抽出	口コミ分析、SNS感情分析

BI（Business Intelligence） は、蓄積されたデータを分析・可視化して経営判断に活かすための手法やツールの総称です。ダッシュボードやレポートでKPI（重要業績評価指標）を可視化し、意思決定を支援します。

データ分析の基礎となる 統計分析 の概念も押さえておきましょう。

概念	説明
平均値	データの合計をデータ数で割った値。外れ値に影響されやすい
中央値	データを大きさ順に並べた中央の値。外れ値の影響を受けにくい
最頻値	最も頻繁に出現する値
標準偏差	データのばらつき度合いを表す指標。値が大きいほどばらつきが大きい
相関係数	2つの変数の直線的な関係の強さ。-1〜+1の範囲
正の相関	一方が増えるともう一方も増える関係（相関係数が+1に近い）
負の相関	一方が増えるともう一方が減る関係（相関係数が-1に近い）

データ活用において重要なのは、相関関係と因果関係は異なる という点です。2つのデータに相関があっても、一方が他方の原因であるとは限りません。

古典的な例として、「アイスクリームの売上」と「溺水事故の件数」には正の相関がありますが、アイスクリームが溺水を引き起こしているわけではありません。どちらも「気温の上昇」という第三の要因（交絡因子）が原因です。このように、相関から安易に因果関係を結論づけてはいけません。

データ分析の結果を適切に解釈し、誤った判断を避ける力が データリテラシー です。現代のビジネスでは、データサイエンティストだけでなく、すべてのビジネスパーソンにデータリテラシーが求められています。データを「読み解く力」「批判的に評価する力」「意思決定に活かす力」がその中核です。

ポイント

ビッグデータは3V（Volume・Velocity・Variety）で特徴づけられる。データウェアハウスは構造化データの分析基盤、データレイクは生データの大規模蓄積に使用される。データマイニングで有用なパターンを発見し、BIで経営判断に活用する。相関関係と因果関係の区別がデータリテラシーの基本である。

用語

ビッグデータ: 大量・高速・多様な形式のデータの集合。3V（Volume・Velocity・Variety）が特徴
データウェアハウス（DWH）: 分析用に整理・蓄積された構造化データの専用データベース
データレイク: あらゆるデータを元の形式のまま蓄積する大規模ストレージ
データマイニング: 大量データから統計やAIで有用なパターンを発見する手法
BI: Business Intelligence。データを分析・可視化し経営判断を支援する手法
ETL: Extract・Transform・Load。データソースからDWH等へのデータ連携処理
相関係数: 2変数の直線的関係の強さを-1〜+1で表す指標

自動復習で、読んだ内容を長期記憶に定着させよう

忘却曲線に基づく SRS が最適なタイミングで自動復習。3回の復習で長期記憶に。