- Disiz Yyov
- Posts
- đ§ Un reÌseau social 100% IA va deÌbarquer
đ§ Un reÌseau social 100% IA va deÌbarquer
đ§ Un rĂ©seau social 100% IA dĂ©barque
Dans lâĂ©dition dâaujourdâhui :
đ Nvidia CrĂ©e Un Nouveau MĂ©tavers
đ§ Un rĂ©seau social 100% IA va dĂ©barquer
đ” L'IA recrĂ©e un extrait de chanson de Pink Floyd Ă partir d'enregistrements de l'activitĂ© cĂ©rĂ©brale
đ Nvidia CrĂ©e Un Nouveau MĂ©tavers
Nvidia a encore une fois volé la vedette en IA avec 2 nouvelles annonces qui ont mis le domaine de l'IA en émoi.
La derniÚre est la plus folle, Nvidia prévoit de surpasser Meta avec ce qu'ils appellent "L'Omniverse."
Mais commençons par la premiÚre.
à moins que vous n'ayez vécu sous une roche, vous savez que nous sommes en pleine crise des puces IA.
Chaque modĂšle IA a besoin de puces IA, et le principal producteur de ces puces (Nvidia) est Ă court. En bref, nous avions besoin de cette puce.
Son nom ?
Le GH200 Grace Hopper Superchip et c'est une BĂTE de puce avec 3 fois plus de mĂ©moire.

Toute cette mémoire permet aux développeurs d'exécuter des modÚles plus grands sur moins de puces et d'économiser plus d'argent. C'est bénéfique pour tous.

Pensez au MĂ©tavers comme un monde oĂč vous pouvez virtuellement passer du temps avec des amis ou assister Ă un concert.
L'Omniverse est comme un méga parc qui contient des milliers de Métavers.
L'objectif de Nvidia est de crĂ©er un endroit oĂč l'IA peut en apprendre davantage sur le monde, mais aussi oĂč nous pouvons expĂ©rimenter des choses sans en subir les effets.
Non seulement la technologie IA va progresser encore plus rapidement avec la nouvelle puce IA, mais la recherche scientifique et architecturale le fera aussi, câest dingue.
đ§ Un rĂ©seau social 100% IA dĂ©barque !
Et ce rĂ©seau sâappelle : BEFAKE

L'ancien PDG de MZ lance BeFake (appstore, googleplay), une application de médias sociaux basée sur l'IA qui offre de nouvelles façons de se connecter avec des amis grùce à des visuels générés par l'IA.
L'application fonctionne exactement comme BeReal, mais avec une différence. Contrairement à BeReal, cette application permet aux utilisateurs d'imaginer et de se placer dans n'importe quel scénario créatif en utilisant l'IA. Les utilisateurs peuvent soit utiliser les prompts textuels pré-faits de l'application, soit entrer les leurs pour concevoir leur image.
đ” L'IA recrĂ©e un extrait de chanson de Pink Floyd Ă partir d'enregistrements de l'activitĂ© cĂ©rĂ©brale

L'extrait audio de 15 secondes ressemble à une version boueuse d'une chanson de Pink Floyd, comme si quelqu'un la chantait sous l'eau. Sauf que Pink Floyd n'a joué aucune des musiques dans l'extrait.
Au lieu de cela, la piste a été créée par une équipe de chercheurs de l'Université de Californie à Berkeley, qui ont examiné l'activité cérébrale de plus de deux douzaines de personnes ayant écouté la chanson.
Ces données ont ensuite été décodées par un modÚle IA et reconstruites en audio, marquant la premiÚre fois que des chercheurs ont pu recréer une chanson à partir de signaux cérébraux.

Peut-ĂȘtre que, dans le futur, cela pourrait potentiellement ĂȘtre utilisĂ© pour communiquer avec d'autres animaux.
đ§ Les 6 meilleurs outils IA de la semaine
â Eightify extrait les idĂ©es principales de longues vidĂ©os Youtube. Il utilise GPT et sa propre technologie pour amĂ©liorer la qualitĂ© des rĂ©sumĂ©s et prendre en charge des vidĂ©os allant jusqu'Ă 32 heures. De plus, le temps moyen de gĂ©nĂ©ration n'est que de 8 secondes.
â Speechflow est un modĂšle d'IA qui convertit l'audio en texte ponctuĂ©, optimisĂ© pour la lisibilitĂ©. Il prend en charge 14 langues, revendique une prĂ©cision 20% supĂ©rieure Ă celle de ses concurrents, et peut traiter une heure d'audio en moins de 3 minutes Ă un coĂ»t de 0,0002 $/seconde. Il dispose d'une API simplifiĂ©e et se intĂšgre facilement grĂące Ă des extraits de code concis.
â Hurd.ai utilise l'IA pour permettre une Ă©coute attentive pendant les confĂ©rences, ateliers et rĂ©unions. Assieds-toi pendant que Hurd.ai capture, transcrit, rĂ©sume et Ă©tiquette votre contenu. Contrairement Ă d'autres qui facturent Ă l'heure, son plan gratuit offre des enregistrements illimitĂ©s et sĂ©curisĂ©s.
â Roll est une plateforme vidĂ©o basĂ©e sur l'IA, qui permet aux utilisateurs de crĂ©er des vidĂ©os captivantes en utilisant seulement un smartphone et un navigateur. Elle propose des visuels de qualitĂ© cinĂ©ma, un audio de premier ordre, des effets multi-camĂ©ras et VFX, des montages audio, un Ă©diteur Roll, et une publication universelle. En exploitant l'IA et l'apprentissage automatique, Roll automatise la production vidĂ©o pour des rĂ©sultats professionnels rapides et Ă©conomiques.
â VectorShift est une plateforme sans code qui permet aux entreprises de crĂ©er des applications IA gĂ©nĂ©ratives. AccĂšde Ă des pipelines prĂ©-construits tels que des gĂ©nĂ©rateurs de documents, des chatbots, et plus encore, ou crĂ©e des solutions personnalisĂ©es.
â VPN gratuit pour Chrome est Un service VPN facile Ă utiliser pour te protĂ©ger lorsque tu navigues sur Internet mais aussi pour accĂ©der Ă Claude.ai.
đ§ Les recherches IA Ă lire absolument
L'article prĂ©sente une approche rĂ©volutionnaire pour gĂ©nĂ©rer des modĂšles humains 3D vĂȘtus, dĂ©taillĂ©s et rĂ©alistes Ă partir d'images uniques. La mĂ©thode utilise une combinaison de prompts textuels descriptifs et d'un modĂšle de diffusion Texte-vers-Image (T2I) pour une reconstruction prĂ©cise. En extrayant des dĂ©tails visibles et indescriptibles, TeCH rĂ©alise des intricatĂ©s, textures et gĂ©omĂ©tries. Il utilise une reprĂ©sentation 3D hybride et un Ă©chantillonnage par distillation de score (SDS) pour l'optimisation. TeCH dĂ©passe les mĂ©thodes existantes en qualitĂ© de rendu et en prĂ©cision gĂ©omĂ©trique, dĂ©montrant son potentiel pour diverses applications. Cette technique innovante comble le fossĂ© entre la guidance textuelle et la gĂ©nĂ©ration humaine 3D, ouvrant la voie Ă des applications plus larges au-delĂ des corps humains.
L'article présente une approche novatrice qui identifie les états pivots dans l'apprentissage par renforcement (RL) à partir de données vidéo. Abordant les défis de compréhension des points de décision en RL, le cadre Deep State Identifier comprend un prédicteur de retour et un détecteur d'état critique. Cette méthode innovante extrait des informations significatives des trajectoires visuelles, améliorant le comportement de l'agent et la comparaison des politiques. Contrairement aux travaux précédents, il fonctionne sans information d'action explicite, améliorant l'interprétabilité en RL. Des expériences extensives valident son efficacité dans divers environnements, soulignant son potentiel pour le RL hiérarchique. L'approche offre une perspective unique sur le RL explicable, démontrant son potentiel pour améliorer les performances de l'agent et simplifier les processus d'explication.
đ RĂ©soudre des problĂšmes mathĂ©matiques complexes Ă l'aide de l'interprĂ©teur GPT-4 avec auto-vĂ©rification basĂ©e sur le code
L'article prĂ©sente l'interprĂ©teur GPT-4 Code (GPT4-Code) pour rĂ©soudre des problĂšmes mathĂ©matiques complexes. GPT-4 Code gĂ©nĂšre et exĂ©cute du code Python pour amĂ©liorer le raisonnement et la rĂ©solution de problĂšmes. L'Ă©tude analyse sa frĂ©quence d'utilisation du code et rĂ©vĂšle ses capacitĂ©s d'auto-dĂ©bogage, attribuant son succĂšs Ă la gĂ©nĂ©ration de code dynamique. Une nouvelle technique d'auto-vĂ©rification basĂ©e sur le code (CSV) est proposĂ©e, guidant GPT-4 Code pour vĂ©rifier et rectifier les solutions Ă l'aide du code. L'approche atteint une impressionnante prĂ©cision en situation inĂ©dite (53,9% â 84,3%) sur le jeu de donnĂ©es MATH, surpassant les mĂ©thodes prĂ©cĂ©dentes. Cette recherche approfondit la comprĂ©hension du raisonnement renforcĂ© par le code dans les LLMs et contribue Ă de nouveaux jeux de donnĂ©es pour amĂ©liorer les capacitĂ©s mathĂ©matiques.
Réalisée par une équipe de chercheurs de Google et de l'Université du Michigan, cette approche présente une méthodologie polyvalente pour doter les LLMs de la capacité de personnaliser la création de contenu. Reflétant les étapes de l'instruction d'écriture, le nouveau cadre englobe une architecture multi-étapes englobant la récupération, le classement, la résumé, la synthÚse et la génération. De plus, la compétence en lecture du modÚle est améliorée par un cadre multitùche, similaire à l'interconnexion des compétences en lecture et en écriture dans l'éducation. Les résultats expérimentaux sur divers jeux de données confirment l'efficacité de l'approche, promettant une nouvelle Úre de génération de texte sur mesure.
Des chercheurs de l'UniversitĂ© de Zhejiang, du MIT Media Lab et de Image Derivative Inc. prĂ©sentent une approche novatrice pour construire des avatars neuronaux relightables et animables Ă partir de vidĂ©os Ă vue Ă©parse (ou monoculaire) d'humains dynamiques. Le nouveau cadre permet la gĂ©nĂ©ration d'avatars qui sont non seulement animables, mais Ă©galement adaptables Ă diffĂ©rentes conditions d'Ă©clairage, un exploit difficile. GrĂące Ă un astucieux algorithme de requĂȘte de distance hiĂ©rarchique (HDQ), les mĂ©thodes calculent efficacement les intersections de surface et la visibilitĂ© de la lumiĂšre, facilitant un relighting rĂ©aliste. Les expĂ©riences montrent les performances supĂ©rieures de l'approche, offrant une voie prometteuse pour la reprĂ©sentation virtuelle humaine dynamique et rĂ©aliste.
Que pensez-vous de la newsletter d'aujourd'hui ? |
Reply