学習データ再学習の自動選別装置

技術の概要

本技術は、学習データを自動生成し、推論結果の信頼度を評価して再学習を最適化する仕組みです。生成データとデータ拡張を組み合わせ、推論性能の向上と学習コストの低減を同時に追求します。

ユースケース

  • 学習データの自動生成と再学習候補の評価・採用
  • データ拡張と生成データの多様性確保による再学習の効果最大化
  • 推論スコアに基づくデータの採用/棄却判断とデータセット更新
  • 生成データの識別IDとパラメータ情報の記録・表示による透明性確保
  • 車載カメラ等の実車認識モデルへの適用と検出精度向上

本技術は、学習データを生成する生成部と、生成データを用いて学習済みモデルへ推論を行い、推論の確からしさを示す第1スコアを出力する推論部を備えます。第1スコアが第1閾値未満であれば、生成データを用いて学習済みモデルを再学習します。データ拡張として、合成、フィルター処理、生成AI など複数手法を組み合わせます。評価部はスコアを基に採用データと棄却データを分け、パラメータ記憶部に生成時のパラメータ情報を保存します。関連付け部はパラメータ種別ごとに識別IDとパラメータ値を結びつけ、表示制御部は画面上で再学習の根拠をわかりやすく提示します。棄却データは分布外かどうかで判断され、再学習データセットは更新され、推論精度の向上を目指します。

本技術は、学習データを自動生成し、推論結果の確度を評価して再学習を選別する統合システムです。生成部は第一学習データを複数の生成手法で作成し、推論部は学習済みモデルを用いて各データに対する推論と第1スコアを出力します。評価部は閾値を用いて採用データと棄却データを分け、採用データは学習部に渡してモデルを再学習させます。棄却データは棄却データ記憶部に格納します。パラメータ記憶部には、生成時のパラメータ情報と識別IDを保存し、関連付け部が種別ごとにパラメータ値とデータを紐付けます。表示制御部は、採用・棄却の根拠となるパラメータ分布・特徴量分布を画面表示します。複数手法を併用する生成部は、データ拡張として合成・フィルター・生成AIを組み合わせ、再学習データの多様性と有用性を高めます。さらにキャリブレーション機能や分布外検出機能を備え、閾値の適正化とデータ品質の維持を図ります。これにより学習コストを抑制しつつ推論性能の向上を安定的に得られる設計となっています。

この技術について問い合わせる

名前
利用規約とプライバシーポリシーに同意して送信する