エビデンスで教育を考えた

頭が良くなる科学論文を紹介していきます。お勧め商品は楽天ルームで!https://room.rakuten.co.jp/room_12b7a40f6d/items

コンペメモ(ベースラインモデルの完成)〜AI Mathematical Olympiad - Progress Prize 1③〜

以下のノートブックを参考にさせていただき、ベースラインモデルを作成しました。
https://www.kaggle.com/code/olyatsimboy/aimo-openmath-mistral-baseline

時間がかかったのが(やはり)環境設定でして、
・bitsandbytesのインポート(使ったことなかった)
・ディレクトリの設定(input/output共に。いつもやり方忘れる)
あたりが鬼門でした。

コンペに不正があった関係?でまだ提出はしていないものの、CSVはいつでも提出できる状態にはなってます。

 しかしながら、、、、

「写経してても何やってるかさっぱり分からん」


といういつもの状態になりました笑。

一応アルゴリズム的には、、

モデル定義
configでモデル設定
トークナイザーの定義
モデルのロード
LLMモデルにテキストを生成させるための例の作成
与えられた文字列(answer)から数値を抽出
問題文を処理して解答を生成し、解答をanswersに追加

となっております。LLM初めてなので今の自分の状態を包み隠さず書くと

「特徴量いじったり前処理考察したりないのか、、、」
「この後の戦略立て辛い」
「生成された答えは一応合ってるが、説明できない」

といった感じ。さてこの後どうしようかな