华为第二批难题一:基于预训练AI模型的元件库生成

news/2024/7/20 17:19:42 标签: 人工智能, 3D模型, 大模型, 知识图谱

我的理解:华为的这个难道应该是想通过大模型技术,识别元件手册上的图文内容,与现有建库工具结合,有潜力按标准生成各种库模型。

正好,我们正在研究,利用知识图谱技术快速生成装配模型,其中也涉及到3D零部件的自动生成。

既然“3D零部件的自动生成”,与华为的这个难题有相似之处,如果华为都需要向外部征求技术方案,那我们就可以省一点力,暂时不要在这块上想太多,:P。

难题一:基于预训练AI模型的元件库生成

技术背景

1. 元件库的Symbol、2D封装,3D结构当前都是根据数据手册手工绘制,每个元件需要花费数小时绘制,每一家电子公司都需要花费大量人力处理;每年行业有数以万计的新元件诞生,迫切需要更为快捷的元器件库生成技术。

2. 传统的元件商城、第三方库提供商开发了自动生成技术,本质上还是规则驱动的自动化技术,泛化性和准确性差,后端需要大量的人工check和修改工作,迫切需要新技术加以改善。

3. 基于多模态预训练模型,能很好识别元件手册上的图文内容,与现有建库工具结合,有潜力按标准生成各种库模型。

技术挑战

传统算法基于规则驱动的自动化设计技术,泛化性和准确性差,后端需要大量的人工check和修改工作。

多模态预训练模型有很好的语义理解、文本/表格/图形识别能力,可以很好解决泛化性问题,但对2D、3D物理图的高精度生成存在很大挑战。

技术诉求

技术需求:

提供基于多模态的专业电路设计预训练模型,输入元件Datasheet,输出该元件

Symbol符号库文件和封装图形库文件的生成,支持3D模型文件的生成。

技术指标:

1. 对于任意可解析、不加密、信息完整的Datasheet,Symbol符号库文件生成信息准确性大于99%;

2. 对于任意可解析、不加密、信息完整的Datasheet,封装图形库文件生成,图形精度0.01mm,识别信息描述准确性大于99%;

3. 对于任意可解析、不加密、信息完整的Datasheet, 3D模型文件生成,图形精度0.01mm。

集成需求:

集成华为云pEDA工具链EDM产品

约束条件:

使用预训练模型开发

参考文献

[1] S. Mori, Historical review of OCR research and development, 1992

[2] Tarek Ahmed Ibrahim Abdelaziz, Applications of integration of AI-based Optical Character

Recognition (OCR) and Generative AI in Document Understanding and Processing, 2023

[3] Fanghao Tian, Automatic Data Extraction Based on Semiconductor Datasheet for Design

Automation of Power Converters, 2022

联系人:吴瑾    lion.wujin@huawei.com


http://www.niftyadmin.cn/n/5371178.html

相关文章

什么是系统工程(字幕)22

0 00:00:00,650 --> 00:00:02,660 那么下一个呢,就是 1 00:00:03,200 --> 00:00:04,770 图16.12 2 00:00:05,740 --> 00:00:07,910 这是一个活动图 3 00:00:09,090 --> 00:00:11,930 表达了蒸馏这个水的 4 00:00:12,280 --> 00:00:13,470 过程的…

【制作100个unity游戏之24】unity制作一个3D动物AI生态系统游戏3(附项目源码)

最终效果 文章目录 最终效果系列目录前言随着地面法线旋转在地形上随机生成动物不同部位颜色不同最终效果源码完结系列目录 前言 欢迎来到【制作100个Unity游戏】系列!本系列将引导您一步步学习如何使用Unity开发各种类型的游戏。在这第24篇中,我们将探索如何用unity制作一…

【Web】Spring rce CVE-2022-22965漏洞复现学习笔记

目录 原理概览 漏洞简述 Tomcat AccessLogValve 和 access_log 例题: 原理概览 spring框架在传参的时候会与对应实体类自动参数绑定,通过“.”还可以访问对应实体类的引用类型变量。使用getClass方法,通过反射机制最终获取tomcat的日志配置成员属性…

Unity学习笔记之【IK反向动力学操作】

反向动力学Inverse Kinematics 反向动力学,简称IK。相较于正向动力学,反向动力学旨在子级对父级产生的影响。 使用IK,可以实现根据目标位置或方向来计算并调整角色的关节(骨骼)链,以使角色的末端&#xff…

Ubuntu22.04 gnome-builder gnome C 应用程序习练笔记(一)

一、序言 gnome-builder构建器是gnome程序开发的集成环境,支持主力语言C, C, Vala, jscript, python等,界面以最新的 gtk 4.12 为主力,将其下版本的gtk直接压入了depreciated,但gtk4.12与普遍使用的gtk3有很大区别,原…

【计算机网络】计算机网络复习资料(期末)

复习要点 一、填空题 1.计算机网络的两个重要基本特点 连通性、共享 2.计算机中的端口号类型 两类端口号 { 服务器端 { 熟知端口号(系统端口号)数值为0~1023 登记端口号,1024~49151 } 客户端使用的端口号:短…

Stable Diffusion 模型下载:ToonYou(平涂卡通)

文章目录 模型介绍生成案例案例一案例二案例三案例四案例五案例六案例七案例八案例九案例十 下载地址 模型介绍 ToonYou 是一个平涂风格的卡通模型,它的画风独特、光感强烈、画面表现力强、场景结构完整,一张张图犹如动画电影截图,非常值得推…

ChatGPT升级版本GPT-4V(ision)支持多模态语音和图像

ChatGPT升级指南:迎接GPT-4V(ision)的全新多模态时代 ChatGPT最新升级引入了GPT-4V(ision),这是一个突破性的多模态版本,支持语音和图像输入。现在,用户可以与ChatGPT进行更加丰富和互动的对话。以下是您升级到GPT-4V(ision)所需…