Shengshu Technology, investie par Ant, a réalisé des dizaines de millions de yuans de financement et teste des milliards de grands modèles en interne

Source : Titanium Media

Auteur : Lin Zhijia

Source de l'image : générée par l'IA illimitée

**Titan Media App a appris en exclusivité que le 9 août, **La société d'IA générative Beijing Shengshu Technology Co., Ltd. (appelée "Shengshu Technology") a annoncé la réalisation de dizaines de millions de yuans en financement providentiel + tour de table. ronde a été financée par Jinqiu Fund Investment, les fonds seront principalement utilisés pour la recherche et le développement d'algorithmes, le développement de produits et l'expansion de l'équipe.

Plus tôt en juin, Shengshu Technology a annoncé l'achèvement d'un financement providentiel de près de 100 millions de yuans par Ant Group, BV Baidu Ventures et Zhuoyuan Capital, avec une valorisation de 100 millions de dollars américains après le premier tour de financement. En moins de deux mois, Shengshu Technology a de nouveau terminé le deuxième tour d'investissement consécutif. (Pour plus de détails, veuillez vous référer à l'article précédent de Titanium Media App : "Ant et Baidu investissent conjointement dans la piste AIGC, la technologie Shengshu est évaluée à 100 millions de dollars après le premier tour de financement")

** Le PDG de Shengshu Technology, Tang Jiayu, a déclaré à Titanium Media App que ** la société prévoyait de créer un grand modèle avec des dizaines de milliards de paramètres. Par rapport à d'autres équipes, la principale barrière de Shengshu réside dans la nature avancée originale de l'architecture de modèle multimodal à grande échelle et la capacité d'innovation continue de l'algorithme sous-jacent.L'équipe a développé un modèle open source à grande échelle Unidiffuser.

**"**Actuellement dans la scène du diagramme de Vincent, notre effet a atteint l'effet de la dernière version du modèle de base de Stable Diffusion, mais il y a encore un certain écart par rapport à Midjourney, principalement en termes d'esthétique. Nous prévoyons de atteindre la dernière version de Midjourney d'ici la fin de l'année", a déclaré Tang Jiayu.

** Il est rapporté que ** Shengshu Technology a été créée en mars 2023. C'est le premier fournisseur mondial d'infrastructures et d'applications génératives d'IA. Une incubation conjointe a été établie, dédiée à la création d'un grand modèle multimodal contrôlable à usage général. Tang Jiayu était auparavant vice-président de Ruilai Wisdom.

** En termes de produits, ** En mars de cette année, l'équipe Shengshu Technology a publié un grand modèle Unidiffuser multimodal open source avec 950 millions de paramètres, utilisant le cadre de réseau unifié sous-jacent U-ViT basé sur l'architecture Transformer pour réaliser la communication entre les modes graphiques et textuels Génération intermodale arbitraire.

Tang Jiayu a déclaré à Titanium Media App qu'à l'heure actuelle, l'industrie se concentre principalement sur la résolution de deux problèmes fondamentaux : l'un consiste à permettre au modèle de comprendre et d'aligner les données de diverses modalités ; l'autre consiste à permettre au modèle de générer du contenu de diverses modalités. La plupart des méthodes reposent toujours sur la combinaison de plusieurs modèles pour gérer les données multimodales, mais Unidiffuser tire parti de l'architecture U-ViT et intègre avec succès le texte et les images dans un seul cadre, et sa version à source fermée intègre davantage le contenu 3D et vidéo.

Actuellement, le noyau de recherche et développement de l'équipe Shengshu Technology a principalement deux aspects : Le premier consiste à développer indépendamment de grands modèles de niveau industriel avec des paramètres plus élevés basés sur la conception de l'architecture de base Unidiffuser, et à intégrer la 3D, pour plus de modalité données telles que la vidéo, à ce stade, un test interne de modèle général à grande échelle avec une échelle de dizaines de milliards de données et de milliards de paramètres a été réalisé, prenant en charge des fonctions telles que la génération de texte et d'image, la génération 3D, et l'édition d'éléments vidéo ;** Le second est **Sur la base des capacités générales sous-jacentes du modèle, rechercher et développer un "ensemble d'outils d'IA" pour les scénarios de création de contenu tels que la création d'images et la création d'actifs 3D. Le produit sera lancé avant la fin de cette année.

** En termes de commercialisation, Tang Jiayu a révélé à Titanium Media App que le chemin de commercialisation de Shengshu Technology est divisé en deux parties : ** D'une part, il s'agit de développer des applications orientées utilisateur final, telles que des assistants de création d'images et les plates-formes de génération d'actifs 3D, qui sont facturées sous forme d'abonnements, etc. ; D'autre part, il fournit des services de modèle d'invocation pour les organisations B-end.

"Nous espérons aider les utilisateurs individuels à résoudre leurs besoins de création d'images dans des scénarios subdivisés tout en obtenant des résultats de haute qualité. Actuellement, l'un de nos produits bêta internes se positionne comme un assistant personnel de création d'images, se concentrant sur des besoins plus généraux de création et d'édition d'images sous-jacentes, Suivez vraiment les mots, permettant aux utilisateurs de créer des images idéales avec des instructions et des interactions extrêmement simples. La difficulté implique des percées technologiques dans la génération contrôlable du modèle sous-jacent, ainsi que les besoins et les intentions des utilisateurs ordinaires dans la création et l'édition d'images. ", a déclaré Tang Jiayu.

Tang Jiayu estime que, par rapport aux modèles à grande échelle basés sur le langage, la recherche nationale et étrangère en direction de modèles multimodaux à grande échelle en est à ses débuts et qu'il n'y a pas de lacune évidente. la généralisation des instructions de modèles à grande échelle et le réglage fin des modèles à grande échelle en sont encore aux premiers stades de la recherche technique et de la vérification dans le monde, de sorte que l'écart entre les pays nationaux et étrangers n'est pas évident. Et dans certaines directions de travail, la Chine est déjà en avance sur les pays étrangers.

** Il convient de noter que ** l'investisseur de Shengshu Technology dans ce cycle, "Jinqiu Fund", entretient une relation étroite avec ByteDance. Le fonds a été créé en mars 2022 par Janna Yang, responsable de l'investissement financier original de ByteDance.La plupart des membres fondateurs sont issus de l'équipe d'investissement originale de ByteDance, des principales institutions nationales de capital-risque et d'entreprises industrielles bien connues.Investissement à long terme. Auparavant, Yang Jie a également travaillé pour Sequoia Capital, Shenzhen Venture Capital, Tongchuang Albert, etc.

À l'heure actuelle, Jinqiu Fund se concentre principalement sur l'IA et les voyages à l'étranger, et a investi dans la plate-forme de services de commerce électronique à l'étranger Jet Commerce, etc., et Yang Jie a travaillé dans de nombreuses entreprises telles que Future Robot, Sharkfit et Zero Rhino Technology.

** Répondant à ce financement, Zheng Xiaochao, vice-président de Jinqiu Fund Investment, a déclaré que les grands modèles et l'IA générative sont actuellement à la tête de la plus grande nouvelle vague de technologie, donnant naissance à de nouveaux outils de productivité et produits d'application, mais leur cœur la force vient toujours de l'innovation du modèle sous-jacent. L'équipe de Shengshu Technology se concentre non seulement sur l'innovation technologique sous-jacente, mais dispose également de capacités de R&D complètes telles que le réseau fédérateur de modèles génératifs profonds, d'échantillonnage à grande vitesse et de génération contrôlable, et possède la force technique profonde pour former le plus grand du monde. modèle de diffusion de 0 à 1. Dans le même temps, au niveau de l'exploration commerciale des produits, l'équipe de Shengshu Technology possède également de solides capacités d'ingénierie et des capacités d'innovation de produits.

Tang Jiayu a déclaré que la technologie d'IA générative permettra à chacun de mieux s'exprimer et de créer. Lorsque l'imagination ne sera plus limitée, l'efficacité de la production sera grandement améliorée et les relations de production traditionnelles et les modèles d'interaction homme-ordinateur seront également remodelés. Future Shengshu Technology continuera à peaufiner les modèles à grande échelle et les produits d'application à usage général, et s'engage à améliorer la créativité et la productivité de tous les êtres humains en libérant continuellement l'imagination. (Cet article est la première version de Titanium Media App, auteur|Lin Zhijia)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)