指南与电子书 Technology

AI 食物识别的工作原理

了解自动化食物浪费识别背后的技术

了解自动化食物浪费识别背后的技术:2,400+ 食物数据库、准确率、混合废弃物类别以及模型改进。

  • 识别数据库涵盖 2,400+ 种食物
  • 所有部署中准确率约 80%
  • 标记修正以改进模型
  • 为您的菜单添加自定义食物
下载PDF 14 pages
AI 食物识别的工作原理 Technology

简介

当我们告诉人们我们的系统使用 AI 来识别食物浪费时,第一个问题通常是:“它有多准确?“这是一个合理的问题。但它并不是理解 AI 食物识别实际功能及其重要性的正确起点。

真正的问题不是”它完美吗?“真正的问题是:“它能给我提供可以据此行动的数据吗?“答案是毫无疑问的——即使 AI 会犯错。

本指南解释了我们的 AI 食物识别如何工作、我们为什么这样设计、它的局限性是什么,以及您如何从它产生的数据中获取最大价值。

要点

  • 我们的 AI 可识别 2,400+ 种不同的食物
  • 我们在所有部署中实现了约 80% 的准确率
  • 当 AI 不够确信时,项目会归入”混合废弃物”
  • 您可以标记修正并添加自定义食物以提高准确率

AI 识别的工作原理

每次有人将食物浪费丢入受监控的垃圾桶时,一系列事件会在毫秒内发生。

识别流程

第 1 步:图像采集

摄像头检测到运动,并在食物进入垃圾桶的瞬间拍摄图像。秤同时记录重量变化。图像 + 重量的配对是系统的基础。

第 2 步:神经网络分析

图像由卷积神经网络处理,该网络经过数百万张食物图像的训练。模型将所看到的内容与其 2,400+ 种食物类别数据库进行比较,寻找它识别的视觉模式。

第 3 步:置信度评分

对于每个潜在匹配,模型计算一个置信度评分——本质上是它对识别结果的确信程度。数据库中的每个类别都会进行此计算,最终产生一个排序的可能性列表。

第 4 步:分类决策

如果最高匹配超过我们的置信度阈值,该项目将被分类为该食物。如果没有匹配足够确信,该项目将归入”混合废弃物”。该阈值经过校准,以在准确性和数据完整性之间取得平衡。

2,400+ 食物数据库

我们的识别模型基于一个涵盖商业厨房中常见的 2,400 多种食物的综合数据库进行训练:

  • 生鲜原料:蔬菜、水果、蛋白质、谷物、乳制品
  • 熟食:常见菜肴、酱料、配菜、甜品
  • 烘焙制品:面包、糕点、蛋糕
  • 饮品:咖啡渣、茶叶、液体废弃物
  • 边角料:果皮、茎秆、骨头、脂肪

这是一个全球模型——同一个 AI 服务于我们所有的部署。它基于全球各地厨房的数据进行训练,这使其在不同菜系和厨房类型中具有强大的适应性。

混合废弃物类别

“混合废弃物”是系统在不够确信无法对项目进行分类时所分配的类别。有些人看到高比例的混合废弃物会认为 AI 失败了。实际上,它正在做它应该做的事情:对不确定性保持诚实。

替代方案会更糟糕

我们可以调整系统使其始终做出猜测,即使在不确定的情况下。结果呢?更多”确信”的分类实际上是错误的。我们宁愿向您展示诚实的不确定性,也不愿展示虚假的精确度。

触发混合废弃物的原因

  • 低置信度评分:AI 的最佳猜测未达到置信度阈值
  • 同时多个项目:几种不同的食物在一次丢弃中混合在一起
  • 不常见的项目:在训练数据中代表性不足的食物
  • 可见性差:光线不佳、摄像头被遮挡或图像模糊

将混合废弃物作为诊断工具

您的混合废弃物百分比实际上是有用的信息:

混合废弃物水平解读
低于 15%条件良好。数据高度细化。
15-30%正常范围。类别级数据良好。
超过 30%值得调查。可能表明存在问题。

常见错误标记场景

没有 AI 系统是完美的。了解模型常见的困难之处有助于您正确解读数据。

视觉相似的食物

AI 看到的是摄像头看到的——它无法品尝或闻到:

  • 米饭 vs 古斯古斯 vs 藜麦
  • 鸡肉 vs 猪肉 vs 火鸡肉
  • 不同形状的意面
  • 酱料和液体

熟食与生食

同一种食材在生的、熟的或混合到菜肴中时看起来非常不同:

  • 生鸡胸肉 vs 烤鸡 vs 咖喱鸡
  • 新鲜蔬菜 vs 烤蔬菜 vs 炒蔬菜
  • 单独的食材 vs 组合在盘中的菜肴

环境因素

光照:光线不佳会改变颜色的呈现方式,使识别更加困难。

摄像头清洁度:摄像头镜头上的油脂、蒸汽残留物或碎屑会降低图像质量。

部分可见:如果食物落在垃圾桶的角落或被部分遮挡,AI 可用的视觉信息就更少。

标记与修正

当您在仪表板中发现错误标记的项目时,可以对其进行标记。这不仅仅是修正您自己的数据——它还有助于改进所有使用该系统的用户的模型。

您的修正很重要

您提交的每个标记都会成为下一次模型更新的训练数据。您正在直接贡献于提高准确率——不仅是为您的站点,而是为所有站点。

如何标记项目

  1. 找到项目:导航到浪费日志或详细视图
  2. 点击标记图标:选择标记或”报告”选项
  3. 选择正确的类别:从列表中选择或搜索
  4. 提交:您的修正会立即更新

何时标记

重点关注:

  • 高频项目:对经常浪费的食物进行修正影响最大
  • 高价值项目:值得准确追踪的昂贵蛋白质或特色食材
  • 反复出现的错误:如果同一项目持续被错误分类,请标记它

添加自定义食物

我们的数据库涵盖了 2,400+ 种常见食物,但每个厨房都有其特色。自定义食物让您可以使用菜单特有的项目来扩展系统。

何时添加自定义食物

  • 您餐厅的招牌菜
  • 全球数据库中没有的地区性或民族特色菜肴
  • 持续被错误分类的项目
  • 您想单独追踪的特定烹饪方式

自定义食物的最佳实践

使用清晰、具体的名称:“自制番茄酱”比”酱料”更好。

选择正确的类别:分配到适当的父类别,以便在报告中正确分组。

不要过度自定义:过多超级具体的项目会使报告更难解读。

为什么 80% 的准确率实际上是优秀的

当人们听到”80% 准确”时,有些人会怀疑这是否足够好。让我们把它放在适当的背景下。

替代方案:手动记录

在 AI 驱动的系统出现之前,食物浪费追踪意味着手动记录。实际情况是:

指标手动记录
合规率通常低于 20%
数据质量不一致、容易出错
员工负担高(减慢服务速度)
可持续性几个月内即被放弃

选择不是在 80% 的 AI 准确率和 100% 的手动准确率之间。而是在 80% 的 AI 准确率和实际上 0% 的可用数据之间。

趋势比单个项目更重要

单个项目的准确性没有您想象的那么重要。真正重要的是:

  • 随时间的一致性测量:即使有一些错误,周与周的趋势是可靠的
  • 类别级准确率:即使”鸡肉”有时是”火鸡肉”,您也知道您的蛋白质浪费总量
  • 总浪费量:秤从不撒谎——您始终确切知道有多少进入了垃圾桶

统计显著性

在数千个数据点上达到 80% 的准确率,错误往往会被平均化。如果 AI 偶尔将米饭称为”古斯古斯”,它也偶尔将古斯古斯称为”米饭”。随着时间推移,您的类别总量会趋近于现实。

提高准确率的最佳实践

优化光照

AI 需要良好的光线才能看清楚。确保垃圾桶区域光线充足,没有强烈的阴影或眩光。

保持摄像头清洁

厨房环境会产生蒸汽和油脂。定期用柔软、干净的布擦拭摄像头镜头。

尽可能一次一种物品

当 AI 一次看到一种食物时,识别效果最佳。一次性倒入混合的盘中剩余物会使识别更加困难。

为您的菜单添加自定义食物

如果您有招牌菜或地区特色菜,将它们添加为自定义食物以实现更准确的追踪。

标记反复出现的错误

如果您注意到同一项目反复被错误分类,请标记它以帮助重新训练模型。

结合 AI 特性解读报告

了解 AI 的工作原理有助于您正确解读浪费报告。

信任汇总数据而非单个项目

您每周”蛋白质:45kg”的汇总比任何单个”2.3kg 鸡肉”的条目都更可靠。

关注趋势

最有价值的洞察来自周与周或月与月的比较:

  • 总浪费量是在上升还是下降?
  • 某些类别是否持续偏高?
  • 干预措施是否产生了效果?
  • 是否存在按星期几或一天中的时间段的规律?

将混合废弃物作为信号

如果您的混合废弃物百分比突然增加:

  • 检查摄像头镜头——可能需要清洁
  • 检查光照——灯泡可能已更换或故障
  • 检查是否有新菜单项目可能需要添加为自定义食物

不要过度解读异常值

如果您看到一个异常条目,在得出结论之前先检查图像。它可能是一个值得标记的错误标签,也可能是一次性事件。

来源与参考文献

  1. Deep Learning for Food Image Recognition - arXiv, Cornell University
  2. Food Recognition: A New Dataset, Experiments, and Results - IEEE
  3. The State of AI in Food Service - McKinsey & Company
  4. Computer Vision in the Food Industry - Trends in Food Science & Technology
  5. Human-in-the-Loop Machine Learning - Stanford HAI

观看 AI 食物识别实际演示