Gemini にデータ サイエンスに向けて質問する前に、データの前処理作業に 1 時間を費やしました

管理者

Gemini にデータサイエンスに向けて質問する前に、データの前処理作業に 1 時間を費やしました

管理者 Jun 23, 2026 0

下流タスク用のデータの準備には多くの時間がかかります。データクリーニング、欠損値の処理、特徴量エンジニアリング、データの前処理または後処理が含まれるかどうかに関係なく、このフェーズには多くの時間がかかります。そこで、私は、他の 2 つの列のデータに基づいて既存の列から値を抽出して、Pandas DataFrame に新しい列を作成する必要がある後処理タスクに取り組んでいました。 LLM に直接コードを書いてもらうこともできましたが (いつもそうしています)、今回は自分で書きたいと思いました。朝だったので頭もすっきりしていたので、複雑なデータ操作を処理する気分でした。これが私がしなければならなかった事です。データフレームがありました predicted_categories、 pred_category_idそして text_predicted_probs カラム。の値 predicted_categories 列には、「category_id」から「category_description」の形式で 5 つのカテゴリがリストされます。…

ニュース24 (Nyūsu 24)

Gemini にデータサイエンスに向けて質問する前に、データの前処理作業に 1 時間を費やしました

YOU MAY HAVE MISSED

ノルウェー対コートジボワール: オランダがチーム発表とともに開始 – ライブ

最高裁判所、出生権市民権を廃止しようとするトランプ大統領の取り組みを破棄し、大統領は惨敗した

最近天気予報が外れやすい理由はここにある

2026年ワールドカップの議論、最善策：火曜日の試合の上位候補にフランスとメキシコが含まれる