エビデンスで教育を考えた

頭が良くなる科学論文を紹介していきます。お勧め商品は楽天ルームで!https://room.rakuten.co.jp/room_12b7a40f6d/items

プログラミング

特徴スケーリングの基本: 標準化と正規化の違いと選び方

この記事では、データ分析や機械学習で重要な「特徴スケーリング」の基礎について解説します。特徴スケーリングはデータを整理し、モデルの精度と計算効率を向上させるために不可欠です。標準化と正規化の2つの主要な方法を紹介し、それぞれの適用場面につい…

データサイエンティスト必見!不均衡データの確認と補正方法を徹底解説

データサイエンティストがデータを扱う際に避けて通れない「不均衡データ」について解説します。不均衡データの確認方法から、オーバーサンプリングやアンダーサンプリングなど、データのバランスを改善するための具体的な手法を紹介し、どのようなケースで…

Notionでデータサイエンスコンペのタスク管理を効率化する方法

Notionを使ってデータサイエンスコンペのタスク管理を効率化する方法を紹介します。締切に追われることなく、プロジェクトを成功に導くための具体的な手順を解説しています。ガントチャートを活用して進行状況を視覚的に管理し、リマインダー機能で締切を守…

コンペメモ(sumitできない問題に取り組む)〜AI Mathematical Olympiad - Progress Prize 1④〜

この記事では、Kaggleの環境でインターネット接続がない状況下で必要なパッケージをインストールし、モデルを使用するための具体的な手順を解説します。特に、bitsandbytesパッケージとOpenMathモデルの設定について詳しく説明します。

コンペメモ(モデルIDの取得とパスの指定に手こずった)〜AI Mathematical Olympiad - Progress Prize 1②〜

数学モデルを利用しようとした際に発生したエラーについて解決方法を解説します。エラーの原因として、モデルIDが正しくない可能性があります。そのため、正しいモデルIDを取得し、再度確認します。

計算論的思考の歩みと現在:プログラミング教育の視点から

プログラミング教育の中で計算論的思考に焦点を当て、その歩みと現在の状況、さらなる向上のための提案を探ります。計算論的思考の発展と教育への応用について、議論を深めます。

コンペメモ〜The Learning Agency Lab - PII Data Detection③〜

今日も元気にモデリング。このエラーがまた出た。 AttributeError: module 'numpy' has no attribute 'object'. `np.object` was a deprecated alias for the builtin `object`. To avoid this error in existing code, use `object` by itself. Doing this …

エンジニア必読:コード理解にかかる時間とその9つの要因とは?

エンジニアリングにおいて、コード理解はスキル向上に不可欠です。しかし、コード理解にはどのくらい時間がかかり、また何がその妨げになるのか?今回の研究では、開発者がどれくらいの時間をコード理解に費やしているのかや、その要因に焦点を当てています…

エンジニアのミスを減らす方法と戦略:科学的アプローチと効果的な解決策とは?

どうも、最近残業多かった男です。5月病を乗り越えました。今回はズバリミスについてのお話です。 次は気をつけようではミスは減らないは科学的に正しい 参考文献[1]では、間違いを犯さないように注意を促すなど人々を変えることに重点を置いた解決策は、間…

名だたるトップ企業エンジニアに聞いた21のコーディングスキルリストとは?

みなさんは良いコードとは?という問いに答えられるでしょうか?私は答えられなくて日々苦労しております。可読性とかいう概念はある程度わかってきたものの、コーディングスキルとは何か、どうすれば伸びるのかという部分に関しては割と明確な答えがないよ…

LDAまとめサイト。

LDAで個人的に良かったサイトまとめました。いや、手抜きじゃないよ笑。 概要 tips-memo.com 原著論文の解説。これでLDAの概要をサクッと把握できる。 さらに深掘り トピックモデルの話 from kogecoo www.slideshare.net LSIとかLDAの前の経緯とかについて書…

エンジニア15年キャリアの人は初心者と比べて何が凄いのか?というメタ分析の話

最近エンジニアやプログラマーはIT業界にお金が流れている関係でそこそこ人気。でも物事が複雑になりすぎて「どんなスキルが必要なの?」とか「どれくらいの習熟が必要なの?」みたいなところまで複雑になっている気がします。データサイエンスなんかもまさ…

無名関数は関数の中に定義すると可読性上がって良いな〜という技術メモ

先輩がlambdaなるものをコードで書いていて「なんじゃこりゃ?」と思って調べました。どうやら無名関数というものらしいです。こちらが簡潔に書いてあって概要は掴めます。qiita.com そのまま引用させていただくと、無名関数だけあって書くのは楽に見えます…

自然言語処理でLookupErrorした

文書を分割する際にnltkを使用したのですが、まあ案の定うまくいかなかったのでメモ。 from nltk import tokenize train['sentense'] = train['text(カラム名)'].apply(lambda x: tokenize.sent_tokenize(x)) で以下のエラーメッセージ。``` LookupError: …

ゲームでプログラミンング能力が上がるのか?

皆様プログラミングの勉強ははかどってますか?私ははかどってないので今日も今日とてプログラミング向上について論文を漁っております。というわけで今回はゲームとプログラミングについて調べた論文をご紹介します。 ボクシングのゲームでシーケンスが上手…

時系列分析~pythonでトレンドの有無を確かめる~

仕事でARIMAモデルを使ってことあるのに、ろくにトレンドとか意識していなかったので反省を込めてメモ。 時系列のトレンドを超ざっくり言うと、時系列に長期的な変化のこと。増加傾向は年々多くの人がその対象を知るようになり、市場が拡大していることの影…

SQLのプリンシプル

良いか、SQLという言語はなぁ、、 FROM ↓ JOIN ON ↓ WHERE ↓ GROUP BY ↓ HAVING ↓ SELECTの順で動くんだ!これが原理原則だ!!これを腹落ちするまで理解できないと、休日を返上する羽目になるんだ。。

特徴量エンジニアリングのメモ。

今回は意外に語られていない(?)テストデータの分割についてのメモです。「特徴量エンジニアリングは終わりがないし、初心者なのでとりあえずモデルに入れてみたい!」とは思うものの、モデルにどうやって入れれば良いかがわかりませんでした。どのタイミ…

ひろゆき流プログラミング独学術とは?

皆様は独学してますか?このブログを読んでいる方なので日々勉強している方も多いとは思います。ですが、「なかなか時間が取れない!」「時間はあるけど思うような成果は出ない。。」そういう方も多いでしょう。そんな人の強い味方(?)としてひろゆきさん…

未経験からデータサイエンティストになるためのSQLおすすめ本6冊

なんか偉そうなタイトルですいません。SQLとはデータサイエンティストやデータアナリストなどの職種では必須のプログラミング言語です。そこについて知識と経験が溜まってきたのでここいらでその辺りを紹介します。 初心者でSQLの本を探している人本の中身が…

スクラッチは取り組みやすいプログラミングだ!説

プログラミングの人気が無いのは世界共通。テック企業がブイブイいわせている昨今では親御さんも教えるのに苦労されているのでは無いかと思うこの頃です。 そんな中で「スクラッチは頼んでやっている!」という研究がありましたのでご紹介。子供に習わせたい…

プログラミング学習はどこが難しい?〜海外研究結果〜

プログラミングしんどい。。。あいも変わらずプログラミングには困らされてばかりの毎日です。何がシンドイって、「何が分からないのか分からないこと」だったりするわけです。 そんな中、「プログラミングってどこが難しいの?」というところを調査してくれ…

データサイエンスの基礎〜タイタニックの乗客〜

以前にもちょろっと取り上げたんですが、kaggleという技術コンペがあります。 Kaggle: Your Machine Learning and Data Science Community 今まで実務で忙しかったんで後回しにしていたんですが、退職して時間に余裕ができたんで登録してみました。kaggleの…

仮想システム(virtual box)にubuntuをインストールする方法

最近は技術メモばかりで恐縮です。PCの動きが良くなくて、「そろそろ替え時かなー」とか思ってたんで、バックアップ代わりに外付けのHDDを購入したんですね。I-O DATA HDD ポータブルハードディスク 2TB USB3.0バスパワー対応 日本製 EC-PHU3W2D発売日: 2016…

pythonでアルゴリズム体操

なんか自然数を与える。するとその数までで、3で割れるものはBUZZ、5で割れるものはFIZZ、3でも5でも割れるものはBUZZ FIZZを出力するコードを書いてみました。 x = input() y = int(float(x))#python comment out for i in range (1,y): if i % 15 == 0…

プログラミングを始めるなら、Scratch(スクラッチ)はいかが?

計算的思考というのが注目されつつあります。計算論的思考とは|テクノロジーに強くなるための思考|探究型プログラミング教室アルスクールのブログ 当ブログでもかなーり前に取り上げたことがあるんですが、内容が抽象的過ぎる トレーニングが分からないな…

トッププログラマーへの道はまだ科学では解明されていない説。

というわけで自分もGWは自粛をしておりました。ブログも書こうと思えば書けたんですがね。それはさておき、今回はプログラマーの話。私みたいなめんどくさがりは最短でトップに食い込みたいと思ってしまうのですが、そういう人でなくともトッププログラマー…

プログラミング教育で何が有効かわかったぞ!と言う最新研究の話。

プログラミング学習に関しては玉石混合だったりします。と言うのも、プログラミング教育自体がまだ新しいためです。そんなわけでゲームを用いてやったりだとか、プログラミングスクールだったりとかが出てきています。私個人としては「計算思考」と言う概念…

Java奮闘記~eclipceで簡単なプログラムを書いてみる~

Javaやeclipceを放置していて久しいので、今回はeclipceで簡単なプログラムを作ってみようかと思います。1、eclipceを起動 こちらが起動画面でした。いやはや、懐かしい。2、パッケージエクスプローラーを表示 現在はプロジェクトエクスプローラーになって…

今週の小ネタ〜AIライターの衝撃〜

不定期となってしまった小ネタ集。今回はAI関連にしぼって紹介していきます。 データサイエンスとデータエンジニアの違い 以下の記事では「データサイエンスってなんぞや?」について調べられたことが書いてあります。サクッとしてて良いです。https://www.y…