paiza times

paizaがお届けする、テック・キャリア・マネジメント領域における「今必要な情報」を届けるWebメディア

logo

paizaがお届けする、テック・キャリア・マネジメント領域の「今必要な情報」を届けるWebメディア

「Pythonデータ分析入門」講座に新レッスン登場!pandasの基本を学ぼう


こんにちは。倉内です。

Pythonは人気の高いプログラミング言語で、paizaラーニングでも、「Python体験編」や「新・Python入門編」などPythonの学習講座は人気があります。

人気の理由はいくつかありますが、基本的な文法がシンプルで理解しやすいことに加え、AI・機械学習やデータ分析に関するライブラリが充実していて扱いやすいというのが挙げられます。

今回新レッスンが追加された、動画講座「Python データ分析入門編」では、Pythonを使用したデータ整形、情報の抽出、可視化といったデータ分析の流れを学べます。Pythonのデータ解析ライブラリであるpandasの学習をこれから始めたい方は、ぜひチェックしてみてください。

学習講座「Python データ分析入門編

paizaラーニングは、Webブラウザとインターネットさえあればすぐにプログラミング学習がスタートできる動画学習サービスです。

特徴として、画面が以下のとおり分割されているため、動画で学びながら実際にコードを書くというインプット・アウトプットの両方ができるという点があります。

今回紹介する「Python データ分析入門編」は、現在2つのレッスンが公開されています。

20221110165727

レッスン1:データ分析を始めよう

データ分析についての学習を始めるにあたって知っておきたい基礎事項について学び、データ分析のイメージをつかみます。

  1. データ分析の概要
  2. データの記録方式
  3. データラングリングとpandas


レッスン2:Seriesの基本

pandasにおけるデータの基本単位であるSeriesの使い方を学習します。

  1. Seriesの作成
  2. 値の参照とスライシング
  3. 更新・追加・削除
  4. Seriesの演算
  5. Seriesの属性
  6. フィルタリング
  7. ソート


pandasとは

Pythonでデータ分析をおこなう際、欠かせないのがpandasというライブラリです。(参考:pandas - Wikipedia

分析対象となるデータは扱いやすい形式でないことが多いため、データ分析の前処理を効率的にできるよう、pandasはデータラングリング・統計処理・可視化などをサポートしています。

なお、データラングリングとは、扱いにくいデータを扱いやすい形にすること、重複した行の削除・欠損値を含む行の削除・文字列データの整形・新しい列の追加などをおこなうことを指します。

講座ではレッスン1のチャプター3「データラングリングとpandas」で取り上げていますのでよければごらんください。

Seriesとは

pandasにおけるデータの基本単位のひとつです。Seriesはインデックス(値に対応するラベル)と値を持っています。

ちなみにSeriesは1次元のデータ列で、2次元のデータ列にはDataFrameというものがあります。


Python×AI・機械学習入門編」も公開中!

Python×AI・機械学習入門編」では、先生役のキャラクター・スヴェータ(CV:上坂すみれさん)と一緒にPythonを使った画像処理と音声認識を実際に手を動かしながら学ぶことができます。


レッスン1:機械学習の概要を知ろう

機械学習の概要を学習します。Pythonの機械学習ツールを使って画像を分類し、機械学習の手順の全体像をつかみましょう。

レッスン2:話者認識をしよう

機械学習で音声認識をします。音声データから特徴量を抽出する方法を学習し、SVMで分類します。

前準備が大変な機械学習も本講座ではJupyter Notebookのインストールなどの環境構築も不要*1で、すぐに始めることができます。

DX白書から見る「データ利活用の現状」

最後に、2023年3月にIPAが公開した「DX白書2023」から昨今のデータ利活用についての概況に触れておきます。

外的要因を含めデジタル化、そしてDX化にビジネスを変革させてでも取り組まなければならないと考えている企業は多く、IPAのDX白書では2021年12月の発行から今回までの変化も読み取ることができます。

まずデータ利活用の状況(日米比較)を見てみます。思ったよりは、米国との差はないように感じます。


(出典)DX白書2023 第1部総論「データ利活用技術」より

では、ビジネスの現場において、データ分析による意思決定を積極的に活用するために、どのような工夫をしているのか尋ねた結果(日米比較)について見てみましょう。


(出典)DX白書2023 第3部第4章「企業競争力を高める経営資源の獲得・活用」より

「従業員の教育」以外の項目が米国と比べて進められていないと同時に、「とくに何もしていない」の割合の多さも目立ちます。

必要とする部署・人だけに任せているのか、そもそもそういったものを推進していく仕組み・体制がないのか…課題はいろいろかと思いますが、まだ道半ばといったところだと思います。

また、DXを推進する人材の評価基準はないと答えた企業が多いため、取り組みが適切に評価される仕組みづくりも必要でしょう。


(出典)DX白書2023 第1部総論「DXを推進する人材の評価」より

合わせて、ビジネスでのニーズは高いものの「人材の量・質ともに不足している」と回答する企業が多い中、求められる人材になるためにどのようなスキルを身につけるべきか、考えていかなければなりません。

人間がプログラミングを学んでデータ分析する必要性があるのか?

この記事の前半では、Pythonでデータ分析をするために必要な知識を学べる講座をご紹介しました。

しかし昨今のChatGPT(大規模言語モデルを用いた対話型AIサービス)の登場、そしてそれを応用してできることを見ていると「人間はもうプログラミングを学ばなくていいかも……」と思う部分もあるかもしれません。実際にChatGPTを活用したデータ分析の手法を解説している記事や動画、ChatGPTを内蔵した分析ツールも見かけます。

しかし、必要とする結果が得られるように指示するのは(今のところ)人間の役割です。AIをうまく活用し、サポートをしてもらうにも知識が要ります。また、既存のものを利用するだけでは自分が求める結果を得られず、データ分析のさせ方自体に手を加えたい場合もあるでしょう。

効率よく、工数をかけずにデータ分析ができるという利点を得るためにも、自分自身の知識・スキルをレベルアップしておいても損はありません。

まとめ

今回は、paizaラーニングの学習講座「Pythonデータ分析入門編」をご紹介しました。

paizaにはプログラミングをブラウザ上で学べるコンテンツを他にも多数ご用意しています。ある程度力がついたら制限時間内に問題を解く「スキルチェック」で腕試しをしてみてください。

また、もっと楽しくプログラミングを学びたいという声にお応えして、プログラミングゲームも公開中!新作ゲーム『異能な僕らと異常な世界』はPythonはもちろん、全28言語で問題に挑戦できます。各種リリース記念キャンペーンも実施中ですので、ぜひチェックしていただければと思います!





paizaラーニング」では、未経験者でもブラウザさえあれば、今すぐプログラミングの基礎が動画で学べるレッスンを多数公開しております。

詳しくはこちら

paizaラーニング

そしてpaizaでは、Webサービス開発企業などで求められるコーディング力や、テストケースを想定する力などが問われるプログラミングスキルチェック問題も提供しています。

スキルチェックに挑戦した人は、その結果によってS・A・B・C・D・Eの6段階のランクを取得できます。必要なスキルランクを取得すれば、書類選考なしで企業の求人に応募することも可能です。「自分のプログラミングスキルを客観的に知りたい」「スキルを使って転職したい」という方は、ぜひチャレンジしてみてください。

詳しくはこちら

paizaのスキルチェック

*1:ブラウザ上で利用できるようにするための操作は多少発生します。

paizaのおすすめコンテンツ

PPG proken プログラミングゲーム「初恋 プログラミング研究会〜海に行こうよ〜」 PPG Bingo プログラミングゲーム「コードレビューBINGO!!」
paiza転職 paiza新卒 EN:TRY paizaラーニング 記事内に記載している情報は、記事公開時点でのものとなります。 Copyright Paiza, Inc, All rights reserved.