私、清水 義孝がKindleで本を出版しました。
ご興味が御座いましたら、ご購入頂けると幸いです。
Pythonの基本的なトピックに重点を絞り、チュートリアル形式で解説しております。プログラミング未経験者や初心者でもわかりやすいよう、丁寧な解説を心がけております。
よくわかるPython3入門⑤総集編 - データ分析・機械学習に欠かせない基本をマスターしよう
本書は「よくわかるPython3入門」シリーズの第5弾で、第1弾から第4弾の内容を全て合わせたものとなります。
第1弾で解説したPythonの基礎と合わせて、科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)というライブラリ、さらにデータ分析によく用いられるPandas(パンダス)というライブラリを解説したものになります。
近年、企業が円滑にビジネスを進める上で取り扱うデータ量は急増し、本格的なビッグデータ時代の到来がさけばれています。それに伴い、これらビックデータを分析しビジネスに活用するデータサイエンティストの需要も高まっており、各企業では、データサイエンティストの育成に力を入れたり、高額な給与で採用したりと、人材不足に対応する動きが盛んになってきています。
データサイエンティストに欠かせないスキルの1つが、データ分析、ディープラーニング、機械学習などに必要となるプログラミングのスキルです。その中でも、Python(パイソン)に関する知識は必要不可欠となります。
Python(パイソン)は、直観的で非常にわかりやすいプログラミング言語で、シンプルに記述することができ、初心者でも大変学びやすい言語です。
また、たくさんのライブラリと呼ばれる再利用可能なプログラムが公開されていて、これらのライブラリを使って、比較的簡単に高度な機能を実現することができます。AIに関連するライブラリも数多くあり、機械学習、ディーブラーニングやデータ分析の分野でも広く使われています。
Pythonの開発環境だけで無く、これらの非常に便利なライブラリがインターネット上で無料で提供されており、費用をかけずに始めることができます。
この本では、今後データサイエンスや機械学習、AIを学習していきたいと考えている方へ向けて、それらの知識の習得に欠かせないPythonの基本的なトピックに重点を絞り、チュートリアル形式で解説していきます。プログラミング未経験者や初心者でもわかりやすいよう、丁寧に解説していきます。特にPythonでデータ分析・AI・機械学習を学ぶ上で欠かせない基礎となる重要な事項を取り上げています。
【 目次 】
第1章. 環境準備
この章では、Pythonを始めるにあたって欠かすことのできない、環境構築の方法について、初心者でもわかりやすいよう、1つ1つの手順を追って、丁寧に説明しています。是非この記事を元にPythonの開発環境を準備し、プログラミングにチャレンジしてください。
第2章. 基本操作
第1章で準備した開発環境について、今後の章の理解に必要となる基本的な操作の説明をしています。
第3章. 変数
最初に基本となるPythonの変数の宣言や変数名のルールを説明しています。変数とは何か?という説明から、具体的な例を用いて使い方の説明など、初心者にもわかりやすいよう丁寧な解説を心がけています。
第4章. データ型
次にPythonに用意されているデータ型の種類とその確認方法を説明しています。
第5章. 数値計算(四則演算)
Pythonでは、数値は四則演算を行うことができるように演算子が用意されています。Pythonに用意されている基本的な四則演算を行うための演算子を確認していきましょう。
第6章. Print関数
画面にメッセージを表示したり、記述したプログラムが正常に動作するか確認する際に、変数などに格納された値を画面に出力するのに必要なprint関数についての解説です。
第7章. リスト(List)
Pythonにおけるリスト(配列)の使い方に関する記事です。リストとは何か?その特徴は?という基本的な説明から始まり、リストへの要素の追加の方法や、追加した要素の変更、削除方法、また検索方法について説明しています。
第8章. タプル(Tuple)
タプルは読み取り専用のリストのようなものです。タプルについても定義の仕方や検索方法について解説していきます。
第9章. ディクショナリ(Dictionary)
Pythonには、キーと紐付けて値を登録することで、取り出しやすいかたちでデータを格納することができるDictionary(辞書)というものがあり、特徴や使い方を取り上げています。
第10章. 条件分岐(IF文)
この章では、Pythonにおける条件分岐(If文)の記述方法や注意点について見ていきます。
第11章. 繰り返し処理(For文)
Pythonの繰り返し処理の1つであるFor文の書き方や使い方の例を取り上げています。
第12章. 繰り返し処理(While文)
Pythonの繰り返し処理にはWhile文もあり、For文との違いやWhile文の使い方を説明しています。
第13章. コメント
プログラムに関する注釈であるコメントについての書き方や、規約・ルールの例、便利な表示方法について解説しています。
第14章. 関数
何度も繰り返し利用する処理は、関数と呼ばれる一連の命令として定義しておくと、同じコードを記述する必要が無く、関数を呼び出すだけで良いので非常に便利です。ここでは、関数の記述方法や呼び出し方について説明しています。
第15章. モジュール、パッケージ、ライブラリ
Pythonでは、科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)、データ解析を支援する機能を提供するPandas(パンダス)など、多くの便利な機能がライブラリという形で提供されます。これらのインストール方法や利用するのに必要な基礎知識について説明しています。
第16章. NumPyでベクトル・行列計算
NumPy(ナンパイ)は、ベクトルや行列などを効率的に数値計算するための数学関数ライブラリを提供します。ここでは次のようなトピックについて解説していきます。
・NumPyでのベクトル、行列の作成方法
・連続した配列の自動作成
・ランダムな数値を含む配列の自動作成
・NumPyでの行列の計算方法
・NumPyでの配列のインデックス
・NumPyでの配列の更新
・NumPyの数値計算用関数
・whereで条件に応じたデータを抽出
・NumPyでのファイル操作関数
第17章. Matplotlibでグラフの描画
Pythonのグラフの描画に欠かせないのが、Matplotlib(マットプロットリブ)になります。Matplotlibは、Pythonのグラフ描画用ライブラリで、様々なグラフを作成し、データを可視化することができます。この章では、Matplotlibで折れ線グラフ、棒グラフ、円グラフ、散布図など各種グラフの描画方法を解説していきます。
第18章. Pandasでデータ分析
Pandas(パンダス)とは、データを効率的に扱うために開発されたPythonのライブラリの1つで、データ分析、機械学習、ディープラーニングには必要不可欠なものになります。ここでは次のようなトピックについて説明していきます。
・Seriesの基本(作成、参照、要素の追加、削除、インデックスなど)
・DataFrameの基本(作成、参照、要素の追加、削除、インデックスなど)
・DataFrameへのインデックス追加と削除
・DataFrameのソート(インデックス、列名、指定した値)
・DataFrameの参照(単一インデックス)
・DataFrameの参照(階層型インデックス)
・DataFrameから条件指定でのデータ抽出
・Excel、CSVファイルの読み込み、書き込み
・DataFrameの結合(Union)
・DataFrameの結合(Join)
・ピボットテーブルの作成
・時系列データの分析
データサイエンティスト
1973年生まれ。
小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。
大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。
論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。
その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。