武汉卓创万象科技有限公司

7 .7

  • 武汉
  • 少于50人
  • 民营企业
  • 双休
  • 社保
  • 正式合同
  • 加班补贴
  • 全勤奖
  • 专业培训
  • 赞同

武汉卓创万象科技有限公司面试

找工易简历库共有58个童鞋曾在武汉卓创万象科技有限公司 工作过,目前尚未提供该公司标准面试题和面试流程,如果你知道武汉卓创万象科技有限公司是怎么面试的,欢迎爆料。

武汉卓创万象科技有限公司对职位的要求是:

  • 图像识别算法工程师:
    岗位职责:
    1、计算机视觉核心算法(图像滤波、图像分类、目标检测、图像分割、图像复原等)的研发;
    2、wav2lip模型的集成和优化:负责将wav2lip模型集成到数字人声音和脸互动系统中,并进行必要的优化,以确保其在实时应用中的高效性和性能。
    3、模型训练和推理:训练并调优wav2lip模型,以适应不同的声音和嘴唇同步需求。
    4、深度学习核心算法(cnn、rnn、gan、rl等)的研发;
    5、实现公司核心算法产品的迭代与优化,完成产品开发周期的升级迭代
    6、负责图像处理与识别算法的代码实现、集成、测试与维护;
    7、负责图像处理软件产品的研发工作;
    8、opencv ,图像识别/处理,ocr,机器学习与模式识别等人工智能相关算法设计与开发,视频数字人。计算机视觉,图像检索;
    9、负责以上开发过程文档编写。
    基本要求:
    1、信息处理、图像处理、模式识别、计算机类相关专业,本科及以上学历;
    2、熟悉和使用过wav2lip框架;熟悉开发工具,能独立编写程序;
    3、熟悉或熟练使用常用图像识别算法框架等;
    4、有2年数字人或者人工智能产品的视觉经验优先。
  • NLP工程师(语音类):
    职责:
    1、语音识别模型开发:设计、开发和优化语音识别模型,将语音信号转化为文本。这可能涉及深度学习技术,如卷积神经网络(cnn)和循环神经网络(rnn)等。
    2、语音合成模型开发:开发文本到语音(tts)合成模型,将文本转化为自然流畅的语音输出。
    3、数据准备和处理:收集、清洗和标注语音数据集,以用于训练和评估语音处理模型。
    4、特征工程:提取和选择适当的语音特征,以供模型训练和推断使用。
    5、模型训练和调优:使用机器学习和深度学习技术训练语音处理模型,并进行超参数调优以提高性能。
    6、语音识别和合成系统集成:将开发的语音识别和合成模型集成到应用程序或系统中,以实现实际应用。
    7、性能评估和优化:评估模型的性能,并采取措施来改进准确性、速度和资源效率。
    8、研究和创新:跟踪最新的语音处理技术和研究成果,以不断改进和创新工作。
    要求:
    1、机器学习和深度学习:熟悉机器学习和深度学习的基本理论和实际应用,包括神经网络、优化算法等。
    2、编程技能:精通编程语言,如python,以便实施和调试语音处理算法和模型。
    3、数据处理:具备数据清洗、标注和处理的技能,能够有效地准备训练数据。
    4、信号处理:了解语音信号处理的基本原理,包括声学特征提取和音频处理技术。
    5、自然语言处理:理解自然语言处理基本概念,因为语音处理通常需要与文本相关的技能。
    6、深度学习框架:熟悉深度学习框架,如tensorflow、pytorch等,以构建和训练模型。
    7、软件工程:具备良好的软件工程实践,包括版本控制、团队协作和文档编写等。
    8、问题解决能力:能够解决复杂的语音处理问题,并具备调试和优化模型的能力。
    9、沟通能力:与团队成员、产品经理和其他相关人员沟通,以确保语音处理项目的顺利推进。
    任职要求:
    1.本科及以上学历,相关专业硕士、博士优先(待遇可谈)。
    2. 熟悉python等编程语言;了解和使用(tts)合成模型。
    3.熟悉和使用过tensorflow、pytorch框架等。
    4.有两年以上相关领域工作经验优先,有实际项目经验的优先。
    5.优秀的学习能力与创新能力,具有良好的沟通协调和团队合作能力。
  • NLP工程师(数字人类):
    岗位职责:
    1、wav2lip模型的集成和优化:负责将wav2lip模型集成到数字人声音和脸互动系统中,并进行必要的优化,以确保其在实时应用中的高效性和性能。
    2、语音到嘴唇同步:开发或改进算法,将语音内容同步到数字人的嘴唇动作,以实现逼真的口型同步。
    3、嘴唇生成和动画:设计和实现嘴唇生成模型,以根据输入的文本或语音内容生成逼真的嘴唇动画。
    4、音频处理:处理音频数据,包括语音识别、情感分析和声音合成,以提供更真实的声音互动体验。
    5、实时互动支持:确保系统能够在实时互动环境中运行,例如实时聊天、虚拟主持人等。
    6、模型训练和调优:训练并调优wav2lip模型,以适应不同的声音和嘴唇同步需求。
    7、性能监控和优化:监控系统性能,优化模型和算法,以确保在各种硬件和网络条件下都能够高效运行。
    技能要求:
    1、深度学习和计算机视觉:深入理解深度学习和计算机视觉原理,尤其是与人脸生成和嘴唇同步相关的技术。
    2、语音处理:具备语音处理技能,包括语音识别、情感分析和声音合成,以实现高质量的声音互动。
    3、wav2lip框架:熟悉wav2lip框架的原理和使用,能够进行模型集成、训练和优化。
    4、编程技能:熟练使用编程语言(通常是python)进行开发,能够处理大规模的视频和音频数据。
    5、模型调优:具备模型调优的经验,以适应特定的声音和嘴唇同步任务。
    6、实时系统开发:有开发实时系统的经验,能够应对延迟和性能要求。
    7、团队合作:具备团队合作和沟通的能力,与其他团队成员(如声音工程师、人机交互设计师)协作以实现整体系统。
    8、创新和解决问题:具备创新思维和解决复杂问题的能力,以满足数字人声音和脸互动领域的挑战。
    任职要求:
    1.本科及以上学历,相关专业硕士、博士优先(待遇可谈)
    2. 熟悉python等编程语言;了解和使用过wav2lip架构
    3.熟悉和使用过wav2lip框架
    4.有两年以上相关领域工作经验优先,有实际项目经验的优先
    5.优秀的学习能力与创新能力,具有良好的沟通协调和团队合作能力
  • 去武汉卓创万象科技有限公司面试前,请依照以上职位要求做好对照,携带好个人简历以及身份证,毕业证和各类资格证书;

分享我的面试经验:

  • *面试职位:
    *面试难度:
    *面试时间:
    • 2024年
    • 2023年
    • 2022年
    • 2021年
    • 1月
    • 2月
    • 3月
    • 4月
    • 5月
    • 6月
    • 7月
    • 8月
    • 9月
    • 10月
    • 11月
    • 12月
    *面试过程:
    *面试感受:
    *面试结果:
    *面试来源:

猜你喜欢

更多职位面试推荐:

温馨提示:

  1. 每天最新的职场资讯 就业风向等 找工易 微信小程序

    关注 百度 小程序

    提供招聘风向 就业前景、劳动法规 找工易 百度小程序

    关注 微信 小程序