Shengshu Technology, con inversión Ant, ha completado decenas de millones de yuanes en financiación y está probando miles de millones de modelos grandes internamente.
**Titan Media App se enteró exclusivamente de que el 9 de agosto, **La empresa de IA generativa Beijing Shengshu Technology Co., Ltd. (denominada "Shengshu Technology") anunció la finalización de decenas de millones de yuanes en financiamiento de ronda ángel +. round fue financiado por Jinqiu Fund Investment, los fondos se utilizarán principalmente para la investigación y el desarrollo de algoritmos, el desarrollo de productos y la expansión del equipo.
A principios de junio, Shengshu Technology anunció la finalización de la financiación de la ronda ángel de casi 100 millones de yuanes de Ant Group, BV Baidu Ventures y Zhuoyuan Capital, con una valoración de 100 millones de dólares estadounidenses después de la primera ronda de financiación. En menos de dos meses, Shengshu Technology completó una vez más la segunda ronda de inversión consecutiva. (Para obtener más información, consulte el artículo anterior de la aplicación Titanium Media: "Ant y Baidu invierten conjuntamente en la pista AIGC, la tecnología Shengshu está valorada en 100 millones de dólares estadounidenses después de la primera ronda de financiación")
** El CEO de Shengshu Technology, Tang Jiayu, le dijo a Titanium Media App que ** la compañía planea crear un modelo grande con decenas de miles de millones de parámetros. En comparación con otros equipos, la barrera central de Shengshu radica en la naturaleza avanzada original de la arquitectura del modelo multimodal a gran escala y la capacidad de innovación continua del algoritmo subyacente.El equipo ha desarrollado un modelo Unidiffuser de código abierto a gran escala.
**"**Actualmente en la escena del diagrama de Vincent, nuestro efecto ha alcanzado el efecto de la última versión del modelo básico de Stable Diffusion, pero todavía hay una cierta brecha en comparación con Midjourney, principalmente en términos de estética. Esperamos llegar a la última versión de Midjourney para el efecto de fin de año", dijo Tang Jiayu.
**Se informa que ** Shengshu Technology se estableció en marzo de 2023. Es el proveedor líder mundial de infraestructura y aplicaciones de IA generativa. Se estableció una incubación conjunta, dedicada a crear un modelo grande de propósito general multimodal controlable. Tang Jiayu se desempeñó anteriormente como vicepresidente de Ruilai Wisdom.
En términos de productos, en marzo de este año, el equipo de Shengshu Technology lanzó el modelo grande multimodal de código abierto Unidiffuser con 950 millones de parámetros, utilizando el marco de red unificado subyacente U-ViT basado en la arquitectura Transformer para Realice la comunicación entre los modos gráfico y de texto.Generación intermodal arbitraria.
Tang Jiayu le dijo a Titanium Media App que en la actualidad, la industria se enfoca principalmente en resolver dos problemas centrales: uno es permitir que el modelo comprenda y alinear datos de varias modalidades; el otro es permitir que el modelo genere contenido de varias modalidades. La mayoría de los métodos todavía se basan en la combinación de múltiples modelos para manejar datos multimodales, pero Unidiffuser aprovecha la arquitectura U-ViT e integra con éxito texto e imágenes en un marco, y su versión de código cerrado integra aún más el contenido de video y 3D.
Actualmente, el núcleo de investigación y desarrollo del equipo de tecnología de Shengshu tiene principalmente dos aspectos: El primero es desarrollar de forma independiente modelos grandes de nivel industrial con parámetros más altos basados en el diseño de la arquitectura central de Unidiffuser e integrar 3D, para obtener más información modal. datos como video, en esta etapa, se ha realizado una prueba interna de modelo general a gran escala con una escala de decenas de miles de millones de datos y miles de millones de parámetros, que admite funciones como generación de texto e imágenes, generación 3D, y edición de elementos de video;** El segundo es **Basado en las capacidades subyacentes del modelo general, investigar y desarrollar un "conjunto de herramientas de IA" para escenarios de creación de contenido, como la creación de imágenes y la creación de activos 3D. El producto se lanzará antes del final de este año.
** En términos de comercialización, Tang Jiayu reveló a Titanium Media App que el camino de comercialización de la tecnología Shengshu se divide en dos partes: ** Por un lado, es desarrollar aplicaciones orientadas al usuario final, como asistentes de creación de imágenes. y plataformas de generación de activos 3D, que se cobran en forma de suscripciones, etc.; por otro lado, brinda servicios de modelo de invocación para organizaciones B-end.
"Esperamos ayudar a los usuarios individuales a resolver sus necesidades de creación de imágenes en escenarios subdivididos mientras logran resultados de alta calidad. Actualmente, uno de nuestros productos beta internos se posiciona como un asistente de creación de imágenes personal, que se enfoca en necesidades de edición y creación de imágenes subyacentes más generales. Siga verdaderamente las palabras, lo que permite a los usuarios crear imágenes ideales con instrucciones e interacciones extremadamente simples. La dificultad involucra avances tecnológicos en la generación controlable del modelo subyacente, así como las necesidades e intenciones de los usuarios comunes en la creación y edición de imágenes. comprensión profunda. ", dijo Tang Jiayu.
Tang Jiayu cree que, en comparación con los modelos a gran escala basados en el lenguaje, la investigación nacional y extranjera en la dirección de modelos multimodales a gran escala se encuentra en la etapa inicial de exploración y no hay una brecha obvia. La generalización de las instrucciones del modelo a gran escala y el ajuste fino de los modelos a gran escala aún se encuentran en la etapa inicial de investigación técnica y verificación en el mundo, por lo que la brecha entre los países nacionales y extranjeros no es obvia. Y en algunas direcciones de trabajo, China ya está por delante de países extranjeros.
**Vale la pena señalar que **el inversor de Shengshu Technology en esta ronda, "Jinqiu Fund", tiene una estrecha relación con ByteDance. El fondo fue establecido en marzo de 2022 por Janna Yang, directora de la inversión financiera original de ByteDance. La mayoría de los miembros fundadores procedían del equipo de inversión original de ByteDance, las principales instituciones de capital de riesgo nacionales y conocidas empresas industriales. Inversión a largo plazo. Anteriormente, Yang Jie también trabajó para Sequoia Capital, Shenzhen Venture Capital, Tongchuang Albert, etc.
En la actualidad, Jinqiu Fund se enfoca principalmente en la IA y en el extranjero, y ha invertido en la plataforma de servicios de comercio electrónico en el extranjero Jet Commerce, etc., y Yang Jie ha trabajado en muchas empresas como Future Robot, Sharkfit y Zero Rhino Technology.
**En respuesta a esta financiación, Zheng Xiaochao, vicepresidente de Jinqiu Fund Investment, dijo que los modelos grandes y la IA generativa están liderando la mayor nueva ola de tecnología en la actualidad, dando origen a nuevas herramientas de productividad y productos de aplicación, pero su núcleo El impulsor la fuerza todavía proviene de la innovación del modelo subyacente. El equipo de tecnología de Shengshu no solo se enfoca en la innovación tecnológica subyacente, sino que también tiene capacidades completas de I + D, como la red troncal de modelos generativos profundos, muestreo de alta velocidad y generación controlable, y tiene la fuerza técnica profunda para entrenar a los más grandes del mundo. modelo de difusión de 0 a 1. Al mismo tiempo, a nivel de exploración de productos comerciales, el equipo de tecnología de Shengshu también tiene sólidas capacidades de ingeniería y capacidades de innovación de productos.
Tang Jiayu dijo que la tecnología de inteligencia artificial generativa permitirá que todos se expresen y creen mejor. Cuando la imaginación ya no esté limitada, la eficiencia de la producción mejorará considerablemente y las relaciones de producción tradicionales y los modelos de interacción humano-computadora también se remodelarán. Future Shengshu Technology continuará puliendo modelos a gran escala de uso general y productos de aplicación, y está comprometida a mejorar la creatividad y la productividad de todos los seres humanos mediante la liberación continua de la imaginación. (Este artículo es el primer lanzamiento de la aplicación Titanium Media, autor|Lin Zhijia)
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Shengshu Technology, con inversión Ant, ha completado decenas de millones de yuanes en financiación y está probando miles de millones de modelos grandes internamente.
Fuente: Medios de titanio
Autor: Lin Zhijia
**Titan Media App se enteró exclusivamente de que el 9 de agosto, **La empresa de IA generativa Beijing Shengshu Technology Co., Ltd. (denominada "Shengshu Technology") anunció la finalización de decenas de millones de yuanes en financiamiento de ronda ángel +. round fue financiado por Jinqiu Fund Investment, los fondos se utilizarán principalmente para la investigación y el desarrollo de algoritmos, el desarrollo de productos y la expansión del equipo.
A principios de junio, Shengshu Technology anunció la finalización de la financiación de la ronda ángel de casi 100 millones de yuanes de Ant Group, BV Baidu Ventures y Zhuoyuan Capital, con una valoración de 100 millones de dólares estadounidenses después de la primera ronda de financiación. En menos de dos meses, Shengshu Technology completó una vez más la segunda ronda de inversión consecutiva. (Para obtener más información, consulte el artículo anterior de la aplicación Titanium Media: "Ant y Baidu invierten conjuntamente en la pista AIGC, la tecnología Shengshu está valorada en 100 millones de dólares estadounidenses después de la primera ronda de financiación")
** El CEO de Shengshu Technology, Tang Jiayu, le dijo a Titanium Media App que ** la compañía planea crear un modelo grande con decenas de miles de millones de parámetros. En comparación con otros equipos, la barrera central de Shengshu radica en la naturaleza avanzada original de la arquitectura del modelo multimodal a gran escala y la capacidad de innovación continua del algoritmo subyacente.El equipo ha desarrollado un modelo Unidiffuser de código abierto a gran escala.
**"**Actualmente en la escena del diagrama de Vincent, nuestro efecto ha alcanzado el efecto de la última versión del modelo básico de Stable Diffusion, pero todavía hay una cierta brecha en comparación con Midjourney, principalmente en términos de estética. Esperamos llegar a la última versión de Midjourney para el efecto de fin de año", dijo Tang Jiayu.
**Se informa que ** Shengshu Technology se estableció en marzo de 2023. Es el proveedor líder mundial de infraestructura y aplicaciones de IA generativa. Se estableció una incubación conjunta, dedicada a crear un modelo grande de propósito general multimodal controlable. Tang Jiayu se desempeñó anteriormente como vicepresidente de Ruilai Wisdom.
En términos de productos, en marzo de este año, el equipo de Shengshu Technology lanzó el modelo grande multimodal de código abierto Unidiffuser con 950 millones de parámetros, utilizando el marco de red unificado subyacente U-ViT basado en la arquitectura Transformer para Realice la comunicación entre los modos gráfico y de texto.Generación intermodal arbitraria.
Tang Jiayu le dijo a Titanium Media App que en la actualidad, la industria se enfoca principalmente en resolver dos problemas centrales: uno es permitir que el modelo comprenda y alinear datos de varias modalidades; el otro es permitir que el modelo genere contenido de varias modalidades. La mayoría de los métodos todavía se basan en la combinación de múltiples modelos para manejar datos multimodales, pero Unidiffuser aprovecha la arquitectura U-ViT e integra con éxito texto e imágenes en un marco, y su versión de código cerrado integra aún más el contenido de video y 3D.
Actualmente, el núcleo de investigación y desarrollo del equipo de tecnología de Shengshu tiene principalmente dos aspectos: El primero es desarrollar de forma independiente modelos grandes de nivel industrial con parámetros más altos basados en el diseño de la arquitectura central de Unidiffuser e integrar 3D, para obtener más información modal. datos como video, en esta etapa, se ha realizado una prueba interna de modelo general a gran escala con una escala de decenas de miles de millones de datos y miles de millones de parámetros, que admite funciones como generación de texto e imágenes, generación 3D, y edición de elementos de video;** El segundo es **Basado en las capacidades subyacentes del modelo general, investigar y desarrollar un "conjunto de herramientas de IA" para escenarios de creación de contenido, como la creación de imágenes y la creación de activos 3D. El producto se lanzará antes del final de este año.
** En términos de comercialización, Tang Jiayu reveló a Titanium Media App que el camino de comercialización de la tecnología Shengshu se divide en dos partes: ** Por un lado, es desarrollar aplicaciones orientadas al usuario final, como asistentes de creación de imágenes. y plataformas de generación de activos 3D, que se cobran en forma de suscripciones, etc.; por otro lado, brinda servicios de modelo de invocación para organizaciones B-end.
"Esperamos ayudar a los usuarios individuales a resolver sus necesidades de creación de imágenes en escenarios subdivididos mientras logran resultados de alta calidad. Actualmente, uno de nuestros productos beta internos se posiciona como un asistente de creación de imágenes personal, que se enfoca en necesidades de edición y creación de imágenes subyacentes más generales. Siga verdaderamente las palabras, lo que permite a los usuarios crear imágenes ideales con instrucciones e interacciones extremadamente simples. La dificultad involucra avances tecnológicos en la generación controlable del modelo subyacente, así como las necesidades e intenciones de los usuarios comunes en la creación y edición de imágenes. comprensión profunda. ", dijo Tang Jiayu.
Tang Jiayu cree que, en comparación con los modelos a gran escala basados en el lenguaje, la investigación nacional y extranjera en la dirección de modelos multimodales a gran escala se encuentra en la etapa inicial de exploración y no hay una brecha obvia. La generalización de las instrucciones del modelo a gran escala y el ajuste fino de los modelos a gran escala aún se encuentran en la etapa inicial de investigación técnica y verificación en el mundo, por lo que la brecha entre los países nacionales y extranjeros no es obvia. Y en algunas direcciones de trabajo, China ya está por delante de países extranjeros.
**Vale la pena señalar que **el inversor de Shengshu Technology en esta ronda, "Jinqiu Fund", tiene una estrecha relación con ByteDance. El fondo fue establecido en marzo de 2022 por Janna Yang, directora de la inversión financiera original de ByteDance. La mayoría de los miembros fundadores procedían del equipo de inversión original de ByteDance, las principales instituciones de capital de riesgo nacionales y conocidas empresas industriales. Inversión a largo plazo. Anteriormente, Yang Jie también trabajó para Sequoia Capital, Shenzhen Venture Capital, Tongchuang Albert, etc.
En la actualidad, Jinqiu Fund se enfoca principalmente en la IA y en el extranjero, y ha invertido en la plataforma de servicios de comercio electrónico en el extranjero Jet Commerce, etc., y Yang Jie ha trabajado en muchas empresas como Future Robot, Sharkfit y Zero Rhino Technology.
**En respuesta a esta financiación, Zheng Xiaochao, vicepresidente de Jinqiu Fund Investment, dijo que los modelos grandes y la IA generativa están liderando la mayor nueva ola de tecnología en la actualidad, dando origen a nuevas herramientas de productividad y productos de aplicación, pero su núcleo El impulsor la fuerza todavía proviene de la innovación del modelo subyacente. El equipo de tecnología de Shengshu no solo se enfoca en la innovación tecnológica subyacente, sino que también tiene capacidades completas de I + D, como la red troncal de modelos generativos profundos, muestreo de alta velocidad y generación controlable, y tiene la fuerza técnica profunda para entrenar a los más grandes del mundo. modelo de difusión de 0 a 1. Al mismo tiempo, a nivel de exploración de productos comerciales, el equipo de tecnología de Shengshu también tiene sólidas capacidades de ingeniería y capacidades de innovación de productos.
Tang Jiayu dijo que la tecnología de inteligencia artificial generativa permitirá que todos se expresen y creen mejor. Cuando la imaginación ya no esté limitada, la eficiencia de la producción mejorará considerablemente y las relaciones de producción tradicionales y los modelos de interacción humano-computadora también se remodelarán. Future Shengshu Technology continuará puliendo modelos a gran escala de uso general y productos de aplicación, y está comprometida a mejorar la creatividad y la productividad de todos los seres humanos mediante la liberación continua de la imaginación. (Este artículo es el primer lanzamiento de la aplicación Titanium Media, autor|Lin Zhijia)