Magi:可自动将漫画转录成文字并自动生成剧本

牛津大学工程科学系的视觉几何组开发了一款名为 Magi 的模型，可以自动将漫画页转录成文字并生成剧本。

该模型通过识别漫画页面上的面板、文字块和角色，实现了全自动的剧本生成功能。其主要功能包括面板检测，识别漫画页面上的各个面板，以及文本块检测，识别面板中的文本块，通常包含对话或叙述性文本。此外，模型还能够检测页面上的角色形象，并根据其身份进行聚类，以区分不同的角色。

Magi 模型还可以将文本与说话者进行关联，确定哪些文本是由页面上的哪个角色说出的，保证剧本的准确性。同时，模型还会按照漫画的阅读顺序对文本块进行排序，确保剧本的叙述逻辑与原漫画一致，让读者通过阅读文本完整地体验漫画故事。

除了 Magi 模型本身，项目还包含一个名为 Mangadex-1.5M 的数据集，其中包含约150万漫画页面，涵盖多种流派和艺术风格。这个数据集的设计旨在为 Magi 模型的训练提供支持，解决漫画页面的自动理解和剧本生成问题，包括面板检测、文本块和角色检测、角色身份聚类以及文本与说话者之间的关联。

通过这一项目，研究人员希望推动漫画领域的自动化处理和理解技术的发展。

论文:https://arxiv.org/abs/2401.10224

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

Magi:可自动将漫画转录成文字并自动生成剧本

OpenAI副总裁称将永远提供免费ChatGPT版本

首个AI软件工程师Devin问世人工智能正式加入编程行列

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

OpenAI副总裁称将永远提供免费ChatGPT版本

首个AI软件工程师Devin问世 人工智能正式加入编程行列

年轻人的第一台AI手机！一加Ace 3V预售：1999元起

网友反馈微软 Copilot 引用谷歌 Gemini 内容，点击链接无法跳转指定内容页面

最早提前 7 天，谷歌借助 AI 能准确预测洪灾

AI真的能赚钱！2024胡润全球富豪榜：一半以上的新增财富来自AI

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

首个AI软件工程师Devin问世人工智能正式加入编程行列