简介
当我们告诉人们我们的系统使用 AI 来识别食物浪费时,第一个问题通常是:“它有多准确?“这是一个合理的问题。但它并不是理解 AI 食物识别实际功能及其重要性的正确起点。
真正的问题不是”它完美吗?“真正的问题是:“它能给我提供可以据此行动的数据吗?“答案是毫无疑问的——即使 AI 会犯错。
本指南解释了我们的 AI 食物识别如何工作、我们为什么这样设计、它的局限性是什么,以及您如何从它产生的数据中获取最大价值。
要点
- 我们的 AI 可识别 2,400+ 种不同的食物
- 我们在所有部署中实现了约 80% 的准确率
- 当 AI 不够确信时,项目会归入”混合废弃物”
- 您可以标记修正并添加自定义食物以提高准确率
AI 识别的工作原理
每次有人将食物浪费丢入受监控的垃圾桶时,一系列事件会在毫秒内发生。
识别流程
第 1 步:图像采集
摄像头检测到运动,并在食物进入垃圾桶的瞬间拍摄图像。秤同时记录重量变化。图像 + 重量的配对是系统的基础。
第 2 步:神经网络分析
图像由卷积神经网络处理,该网络经过数百万张食物图像的训练。模型将所看到的内容与其 2,400+ 种食物类别数据库进行比较,寻找它识别的视觉模式。
第 3 步:置信度评分
对于每个潜在匹配,模型计算一个置信度评分——本质上是它对识别结果的确信程度。数据库中的每个类别都会进行此计算,最终产生一个排序的可能性列表。
第 4 步:分类决策
如果最高匹配超过我们的置信度阈值,该项目将被分类为该食物。如果没有匹配足够确信,该项目将归入”混合废弃物”。该阈值经过校准,以在准确性和数据完整性之间取得平衡。
2,400+ 食物数据库
我们的识别模型基于一个涵盖商业厨房中常见的 2,400 多种食物的综合数据库进行训练:
- 生鲜原料:蔬菜、水果、蛋白质、谷物、乳制品
- 熟食:常见菜肴、酱料、配菜、甜品
- 烘焙制品:面包、糕点、蛋糕
- 饮品:咖啡渣、茶叶、液体废弃物
- 边角料:果皮、茎秆、骨头、脂肪
这是一个全球模型——同一个 AI 服务于我们所有的部署。它基于全球各地厨房的数据进行训练,这使其在不同菜系和厨房类型中具有强大的适应性。
混合废弃物类别
“混合废弃物”是系统在不够确信无法对项目进行分类时所分配的类别。有些人看到高比例的混合废弃物会认为 AI 失败了。实际上,它正在做它应该做的事情:对不确定性保持诚实。
替代方案会更糟糕
我们可以调整系统使其始终做出猜测,即使在不确定的情况下。结果呢?更多”确信”的分类实际上是错误的。我们宁愿向您展示诚实的不确定性,也不愿展示虚假的精确度。
触发混合废弃物的原因
- 低置信度评分:AI 的最佳猜测未达到置信度阈值
- 同时多个项目:几种不同的食物在一次丢弃中混合在一起
- 不常见的项目:在训练数据中代表性不足的食物
- 可见性差:光线不佳、摄像头被遮挡或图像模糊
将混合废弃物作为诊断工具
您的混合废弃物百分比实际上是有用的信息:
| 混合废弃物水平 | 解读 |
|---|---|
| 低于 15% | 条件良好。数据高度细化。 |
| 15-30% | 正常范围。类别级数据良好。 |
| 超过 30% | 值得调查。可能表明存在问题。 |
常见错误标记场景
没有 AI 系统是完美的。了解模型常见的困难之处有助于您正确解读数据。
视觉相似的食物
AI 看到的是摄像头看到的——它无法品尝或闻到:
- 米饭 vs 古斯古斯 vs 藜麦
- 鸡肉 vs 猪肉 vs 火鸡肉
- 不同形状的意面
- 酱料和液体
熟食与生食
同一种食材在生的、熟的或混合到菜肴中时看起来非常不同:
- 生鸡胸肉 vs 烤鸡 vs 咖喱鸡
- 新鲜蔬菜 vs 烤蔬菜 vs 炒蔬菜
- 单独的食材 vs 组合在盘中的菜肴
环境因素
光照:光线不佳会改变颜色的呈现方式,使识别更加困难。
摄像头清洁度:摄像头镜头上的油脂、蒸汽残留物或碎屑会降低图像质量。
部分可见:如果食物落在垃圾桶的角落或被部分遮挡,AI 可用的视觉信息就更少。
标记与修正
当您在仪表板中发现错误标记的项目时,可以对其进行标记。这不仅仅是修正您自己的数据——它还有助于改进所有使用该系统的用户的模型。
您的修正很重要
您提交的每个标记都会成为下一次模型更新的训练数据。您正在直接贡献于提高准确率——不仅是为您的站点,而是为所有站点。
如何标记项目
- 找到项目:导航到浪费日志或详细视图
- 点击标记图标:选择标记或”报告”选项
- 选择正确的类别:从列表中选择或搜索
- 提交:您的修正会立即更新
何时标记
重点关注:
- 高频项目:对经常浪费的食物进行修正影响最大
- 高价值项目:值得准确追踪的昂贵蛋白质或特色食材
- 反复出现的错误:如果同一项目持续被错误分类,请标记它
添加自定义食物
我们的数据库涵盖了 2,400+ 种常见食物,但每个厨房都有其特色。自定义食物让您可以使用菜单特有的项目来扩展系统。
何时添加自定义食物
- 您餐厅的招牌菜
- 全球数据库中没有的地区性或民族特色菜肴
- 持续被错误分类的项目
- 您想单独追踪的特定烹饪方式
自定义食物的最佳实践
使用清晰、具体的名称:“自制番茄酱”比”酱料”更好。
选择正确的类别:分配到适当的父类别,以便在报告中正确分组。
不要过度自定义:过多超级具体的项目会使报告更难解读。
为什么 80% 的准确率实际上是优秀的
当人们听到”80% 准确”时,有些人会怀疑这是否足够好。让我们把它放在适当的背景下。
替代方案:手动记录
在 AI 驱动的系统出现之前,食物浪费追踪意味着手动记录。实际情况是:
| 指标 | 手动记录 |
|---|---|
| 合规率 | 通常低于 20% |
| 数据质量 | 不一致、容易出错 |
| 员工负担 | 高(减慢服务速度) |
| 可持续性 | 几个月内即被放弃 |
选择不是在 80% 的 AI 准确率和 100% 的手动准确率之间。而是在 80% 的 AI 准确率和实际上 0% 的可用数据之间。
趋势比单个项目更重要
单个项目的准确性没有您想象的那么重要。真正重要的是:
- 随时间的一致性测量:即使有一些错误,周与周的趋势是可靠的
- 类别级准确率:即使”鸡肉”有时是”火鸡肉”,您也知道您的蛋白质浪费总量
- 总浪费量:秤从不撒谎——您始终确切知道有多少进入了垃圾桶
统计显著性
在数千个数据点上达到 80% 的准确率,错误往往会被平均化。如果 AI 偶尔将米饭称为”古斯古斯”,它也偶尔将古斯古斯称为”米饭”。随着时间推移,您的类别总量会趋近于现实。
提高准确率的最佳实践
优化光照
AI 需要良好的光线才能看清楚。确保垃圾桶区域光线充足,没有强烈的阴影或眩光。
保持摄像头清洁
厨房环境会产生蒸汽和油脂。定期用柔软、干净的布擦拭摄像头镜头。
尽可能一次一种物品
当 AI 一次看到一种食物时,识别效果最佳。一次性倒入混合的盘中剩余物会使识别更加困难。
为您的菜单添加自定义食物
如果您有招牌菜或地区特色菜,将它们添加为自定义食物以实现更准确的追踪。
标记反复出现的错误
如果您注意到同一项目反复被错误分类,请标记它以帮助重新训练模型。
结合 AI 特性解读报告
了解 AI 的工作原理有助于您正确解读浪费报告。
信任汇总数据而非单个项目
您每周”蛋白质:45kg”的汇总比任何单个”2.3kg 鸡肉”的条目都更可靠。
关注趋势
最有价值的洞察来自周与周或月与月的比较:
- 总浪费量是在上升还是下降?
- 某些类别是否持续偏高?
- 干预措施是否产生了效果?
- 是否存在按星期几或一天中的时间段的规律?
将混合废弃物作为信号
如果您的混合废弃物百分比突然增加:
- 检查摄像头镜头——可能需要清洁
- 检查光照——灯泡可能已更换或故障
- 检查是否有新菜单项目可能需要添加为自定义食物
不要过度解读异常值
如果您看到一个异常条目,在得出结论之前先检查图像。它可能是一个值得标记的错误标签,也可能是一次性事件。
来源与参考文献
- Deep Learning for Food Image Recognition - arXiv, Cornell University
- Food Recognition: A New Dataset, Experiments, and Results - IEEE
- The State of AI in Food Service - McKinsey & Company
- Computer Vision in the Food Industry - Trends in Food Science & Technology
- Human-in-the-Loop Machine Learning - Stanford HAI