使用基于新鮮度傳感器的生鮮品的新鮮度的信息對生鮮品的環境的控制條件執行強化學習,自動地控制生鮮品的環境。具有:新鮮度判斷部(520),其取得收納庫內收納的生鮮品的新鮮度的信息;以及分析部(530),其通過強化學習對針對由新鮮度判斷部(520)取得的生鮮品的新鮮度的收納庫內的庫內環境執行學習,決定在該學習中使用的報酬。分析部(530)根據基于由新鮮度判斷部(520)取得的新鮮度決定出的針對該新鮮度的庫內環境下的固定期間的新鮮度降低情況,來決定報酬。而且,分析部(530)基于所決定的報酬對針對新鮮度的庫內環境執行學習。
聲明:
“學習裝置、生鮮品的收納裝置和程序” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)