谷歌开源 Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

谷歌近日更新博文,宣布开源 Magika基于人工智能快速高效地识别文件格式和内容类型,相关源代码已托管到 GitHub 上。

谷歌开源 Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

Magika 采用了一个定制的、高度优化的深度学习模型,即使在 CPU 上运行,也能在几毫秒内精确识别文件类型。

谷歌开源 Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

谷歌分享 Magika 的性能数据,100 多种格式的 100 万个文件基准评估测试结果显示,Magika 的性能比现有工具高出约 20%,Magika 的精确度和召回率均达到 99% 以上。

谷歌开源 Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

谷歌开源 Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

在内部,谷歌已经利用 Magika 加强用户安全。该系统已大规模部署,用于将 Gmail、Drive 和安全浏览中的文件发送到适当的安全和内容策略扫描器。与以前依赖手工创建规则的系统相比,谷歌通过 Magika 发现文件类型识别的准确率提高了 50%。

谷歌表示 VirusTotal 集成 Magika 之后,进一步提高平台的效率和准确性。在 VirusTotal 的 Code Insight 对文件进行分析之前,Magika 将起到预过滤的作用,Code Insight 使用谷歌的生成式人工智能来检测恶意代码。

声明:内容均采集自公开的网站等各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

辅助提高编程效率,泄露文件显示谷歌已开发内部专供 AI模型“鹅”

2024-2-17 8:44:16

资讯

OpenAI 王炸:新 Sora 模型一句话生成 1 分钟视频,效果接近实拍

2024-2-17 8:48:48

搜索