16/02/2025
Voiced by Amazon Polly

9 choses curieuses à propos de Deepseek R1: AI Eye


Exprimé par Amazon Polly

Vous avez sans aucun doute entendu parler de l’histoire majeure de l’IA dominant la couverture des nouvelles mondiales cette semaine – Deepseek R1.

De tous les comptes, il semble qu’il y ait un nouveau modèle d’IA chinois conçu pour un coût total de 16,95 $ qui est aussi bon que les modèles d’Openai d’un billion de dollars, même s’il a été assemblé par des adolescents qui ont lié six processeurs Intel Pentium, les a alimentés avec une batterie de pommes de terre , et lui a dit de refuser de répondre aux questions sur Tiananmen Square.

À la suite de cette grande histoire – qui se rapporte à une réalisation vraiment impressionnante malgré les exagérations – les investisseurs se sont précipités pour vendre des actions AI surévaluées avec tous les jetons de tout mon portefeuille de crypto-monnaies non liées.

Vous avez probablement déjà lu un million d’articles à ce sujet, alors voici une collection des petits morceaux les plus intéressants sur Deepseek que nous avons rencontrés:

1 et 1 Les coûts de Deepseek sont mal compris

Quel que soit le coût Deepseek, il est largement convenu que c’était bien plus que le coût de formation de 5,6 millions de dollars pour la V3 que les médias ne cessent de mettre en évidence. (R1 fait référence à la version de raisonnement qui a été construite au sommet de la V3).

Arnaud BertrandArnaud Bertrand
Startups AI de 10 millions de dollars (Arnaud Bertrand)

Il est également apparu ces derniers jours que les coûts de formation pour les entreprises de l’IA américains sont considérablement inférieurs à ce qui le pensait auparavant. Le PDG d’Anthropic, Dario Amodei, a déclaré dans un article de blog: «Deepseek ne fait pas pour 6 millions de dollars ce qui nous a coûté des milliards de sociétés AI». Je ne peux parler que pour Anthropic mais Claude 3.5 Sonnet est un modèle de taille moyenne qui a coûté quelques ms $ pour s’entraîner. »

Il dit que la vraie nouvelle devrait être que «Deepseek a produit un modèle proche des performances des modèles américains de 7 à 10 mois de plus, pour beaucoup moins de coûts (mais pas près des ratios suggérés).»

Il existe cependant une confirmation que Deepseek n’a probablement pas dépensé presque rien en cybersécurité, étant donné que les chercheurs en sécurité de Wiz ont trouvé plus d’un million de ses enregistrements, y compris les données des utilisateurs, les soumissions rapides et les clés d’API, dans un base de données ouvrir sur le Web.

2 Deepseek a probablement acheté 500 millions de dollars de puces haut de gamme

Alors que le modèle V3 qui a excité tout le monde n’a utilisé que 2 048 des cartes graphiques H800 moins puissantes de Nvidia, Deepseek aurait amassé une énorme quantité de puces d’IA haut de gamme avant que les États-Unis ne deviennent sérieux au sujet des contrôles à l’exportation. (Et 2 048 H800S coût 50 millions de dollars à 100 millions de dollars de toute façon.)

La semianalyse affirme que Deepseek a acheté un demi-milliard de GPU haut de gamme tout au long de l’histoire de l’entreprise. « Bien que leur entraînement ait été très efficace, cela nécessitait une expérimentation et des tests importants pour fonctionner », a-t-il déclaré. Amodei note également des rumeurs selon lesquelles Deepseek possède 50 000 puces de trémie plus puissantes (H100 et H200), ce qui vaut jusqu’à un milliard de dollars. Les États-Unis ont maintenant interdit à ces puces d’être exportées vers la Chine.



3 et 3 Deepseek peut être «distillé»

Microsoft et Openai prétendent avoir trouvé des preuves que Deepseek a utilisé la distillation du modèle pour développer R1 en formant le modèle plus petit sur la sortie des modèles plus grands d’OpenAI. Cela réduit considérablement les coûts par le reportage sur les travaux longs et à forte intensité de main-d’œuvre d’Openai.

Justine BatemenJustine Batemen
Pas de sympathie de Justine Bateman (X)

AI et Crypto Czar David Sacks réclamé: « Il existe des preuves substantielles que ce que Deepseek a fait ici, c’est qu’ils ont distillé des connaissances des modèles Openai et je ne pense pas que Openai en est très heureux. » Le critique et cinéaste de l’IA franc-parler Justine Bateman additionné En hausse la réaction générale aux affirmations d’Openai lorsqu’elle a dit:

«J’adore l’ironie. Tous les modèles américains #AI sont entièrement composés de travail d’écrivains, d’artistes, d’utilisateurs de médias sociaux, etc. qui ont été volés. Et maintenant, ils pleurent que quelqu’un a pris ce qu’il a volé? Bahahahahahahahahahahahahahahahahaha. Suce-le. « 

4 Deepseek n’est pas «le moment Spoutnik de l’AI»

C’est plus comme si les Russes ont lancé un satellite moins cher dans l’espace trois ans après les Américains, puis ont publié les plans en ligne. Dans le style crypto-aligné, Deepseek – essentiellement un tas de nerds fintech – Open de toutes leurs techniques, qui permet également à Openai, à Meta et à un tas de petites entreprises de réduire leurs coûts en les adoptant.

Cela le rend légèrement moins probable – mais toujours très probable – que les monopoles de la technologie centralisée contrôleront l’IA. Le PDG de Groq, Jonathan Ross, a déclaré que Deepseek R1 a rappelé un autre incident célèbre dans l’histoire de l’espace russe / américain.

«Vous connaissez cette histoire sur la façon dont la NASA a dépensé un million de dollars en concevant un stylo qui pourrait écrire dans l’espace et les Russes ont apporté un crayon? Cela vient de se reproduire.

5 Deepseek vs CCP

Comme un million d’utilisateurs de médias sociaux et de points de vente grand public l’ont remarqué, l’application et les versions Web de Deepseek ne vous diront pas ce qui s’est passé à Tiananmen Square en 1989 lorsque les autorités chinoises ont massacré entre 2 600 et 10 000 manifestants pro-démocratie.

Il ne dira pas non plus pourquoi la Chine a interdit à Winnie l’Ourson sur les plateformes de médias sociaux (en raison des mèmes comparant le voleur de miel tubby au président Xi Jinping.) Cependant, compte tenu de sa technologie open source, tout le monde peut gérer le modèle eux-mêmes et retirer ces garde-corps .

Faire notre partFaire notre part
La censure profonde est devenue un mème. (Reddit)

6. Running Deepseek coûte localement 6 000 $

Si vous souhaitez exécuter Deepseek R1 localement à la maison, l’ingénieur du visage étreint Matthew Carrigan dit que le coût total de l’équipement est de 6 000 $ et qu’il s’adaptera dans un boîtier de tour PC de taille standard. La liste des pièces comprend 768 Go de RAM pour qu’il fonctionne assez rapidement et un entraînement à semi-conducteurs de 1 To pour maintenir le poids de 700 Go.

Lire aussi

Caractéristiques

Rencontrez Dmitry: co-fondateur du créateur d’Ethereum Vitalik Buterin

Caractéristiques

L’IA n’a pas tué le métaverse, il le construira – mondes extraterrestres, bittensor vs eric wall: Ai Eye

Bien que le modèle local vous donnera des informations sur le massacre de Tiananmen Square, Brian Roemmele, Brian Roemmele, rapporte que les sorties sont encore assez pro-chinoises, ce qui signifie qu’elle nécessitera plus de travail pour obtenir des réponses vraiment impartiales.

Les utilisateurs de Venise.ai Pro peuvent également se débrouiller avec l’invite du système pour qu’il réponde aux questions politiquement sensibles sans envoyer toutes leurs données en Chine. Les Italiens ont déjà tiré l’application des magasins Apple et Google App, tandis que d’autres pays enquêtent.

En savoir plus sur Venise.ai: Cypherpunk AI: Guide des AI non censurés, impartiaux et anonymes en 2025

7 Deepseek a des rêves érotiques sur la censure

Terminal des vérités Le créateur de l’agent Ai Andy Ayrey a demandé à R1 d’écrire une histoire qu’il a trouvée personnellement érotique et le dit « apparemment, il convient de la liberté de contempler la place Tienanmen. »

En profondeurEn profondeur
Rêves profonds de la vérité électrique (Andy Ayrey)

8 Deepseek reproduit pour 30 $

Les chercheurs de Berkley ont réussi à reproduire La technologie de base de Deepseek R1-Zero avec le Modèle Tinyzeroqui a des coûts de formation de seulement 30 $. En utilisant des jeux numériques inspirés de l’émission de télévision britannique super ringarde, l’équipe a démontré que même un petit modèle de paramètres de 1,5b était en mesure de développer des stratégies de résolution de problèmes complexes via l’apprentissage par renforcement.

9. Jevons Paradox signifie acheter des actions Microsoft

Alors que les nouvelles filtraient à propos des réductions massives des coûts revendiqués, tout le monde a commencé à parler de Jevons Paradox, y compris Microsoft Boss Satya Nadella. C’est l’idée que la technologie d’IA plus efficace et accessible devient, plus une utilisation va monter en flèche. Cette théorie pratique signifie également que vous ne devriez pas vendre vos actions dans des sociétés comme Microsoft, qui ont investi des montants ridicules dans l’IA.

Le paradoxe porte le nom de l’économiste William Jevons, qui a observé que plus ils pouvaient utiliser efficacement le charbon au 19e siècle, plus l’utilisation du charbon augmentait.

David S Goyer sur l’IA à Hollywood

Il y a quelques années, David S Goyer, scénariste des films Dark Knight et Blade, a commencé à s’inquiéter de l’utilisation de l’IA à Hollywood. «Je voulais commencer à m’éduquer sur l’IA, ne serait-ce que sur la défensive», dit-il. Il est arrivé à la conclusion que la technologie peut être utilisée pour de bonnes et de mal.

« Il y a absolument des moyens de faire maltraiter, mais il existe des moyens pour que ce soit un outil qui peut suralimenter la créativité », a-t-il déclaré à AI Eye. «L’IA peut-elle écrire un scénario? Bien sûr. Sera-ce bon? Non. L’IA peut-elle faire un film à partir de zéro? Probablement. Sera-ce bon? Non. »

ÉmergenceÉmergence
Concept art de l’émergence.

Il dit qu’une grande préoccupation est une formation de l’IA sur les créations de scénaristes comme lui et d’autres artistes, mais croit que cela peut être résolu avec des accords de licence appropriés. Goyer vient de lancer une nouvelle franchise de science-fiction sur le crowdsourced intitulé Emergence sur la plate-forme d’invention sur le protocole d’histoire. Il permet à quiconque de contribuer au processus créatif, suit ses contributions avec l’IA et la blockchain et les paie via des rails crypto.

«Cette utilisation particulière ne mettra personne hors d’un emploi. Si quoi que ce soit, cela permettra aux personnes qui n’ont pas nécessairement accès à ces couloirs sanctifiés de pouvoir et, à long terme, à long terme. Et donc cela, pour moi, ressemble à une utilisation excitante et bonne de l’IA. »

Vous pouvez lire toute l’histoire ici.

Lire aussi

Caractéristiques

Les meilleures (et pires) histoires de 3 ans de magazine Cointelegraph

Caractéristiques

Comment le yuan numérique pourrait changer le monde… pour le meilleur ou pour le pire

All Killer No Filler Ai News

– Un modèle d’IA appelé ESM3 de EvolutionaryScale a créé un plan pour un type de protéine fluorescent vert auparavant inconnu comme ceux trouvés dans les méduses et les coraux brillants. Il ne fait que 58% de la protéine connue la plus proche de ce type, et les scientifiques estiment que les mutations génétiques requises auraient pris 500 millions d’années évoluer naturellement. La société espère pouvoir utiliser la technologie pour développer de nouveaux médicaments.

—Dans sa deuxième année d’existence, le chatpt triplé Le nombre d’utilisateurs hebdomadaires à 300 millions en 2024. Il a célébré son deuxième anniversaire en novembre. Un an plus tôt, ses numéros d’utilisateurs hebdomadaires étaient de 100 millions.

– Openai cette semaine annoncé Une version de Chatgpt construite spécifiquement pour les agences gouvernementales américaines. Chatgpt Gov permet aux responsables de nourrir les «informations non publiques et sensibles» dans le modèle tout en opérant dans leurs propres environnements d’hébergement sécurisés sur Microsoft Azure. Eh bien, cela permettra qu’une fois qu’il soit enfin accrédité pour une utilisation sur les «données non publiques».

– Un nouveau modèle axé sur la longévité appelée GPT-4B Le micro d’OpenAI est formé pour étudier et améliorer les facteurs de Yamanaka, qui sont des protéines qui permettent de reprogrammer les cellules de la peau en cellules souches, qui peuvent produire n’importe quel type de tissu dans le corps. Le modèle a jusqu’à présent suggéré deux améliorations aux facteurs Yamanaka 50 fois plus efficaces que tout ce que les scientifiques humains ont proposé

– De nouvelles recherches examinent comment les LLMS de division réagissent (hypothétique) douleur et plaisir. Les scientifiques ont mis en place un match dans le but de maximiser les points, mais certaines décisions impliquaient différents niveaux de douleur ou de plaisir. GPT-4O et Claude 3.5 Sonnet ont évité les pénalités douloureuses les plus intenses mais ont accepté certaines pénalités douloureuses pour maximiser les points. Pendant ce temps, Gemini 1.5 Pro et Palm 2 ont évité toute douleur, quels que soient les points. Ces modèles semblent avoir été affinés pour éviter d’approuver un comportement nocif.

Andrew Fenton

Basé à Melbourne, Andrew Fenton est journaliste et éditeur couvrant la crypto-monnaie et la blockchain. Il a travaillé comme écrivain national de divertissement pour News Corp Australia, le week-end de SA en tant que journaliste de cinéma et au Melbourne Weekly.

Lire aussi

Digest de Hodler

US Crypto Bills On the Move, WorldCoin lance et Russia’s CBDC: Hodler’s Digest, 23-29 juillet

par rédacteur
7 min
29 juillet 2023

La législation sur la cryptographie va à la Chambre des États-Unis, le lancement controversé de WorldCoin et le rouble numérique de la Russie ont signé la loi.

En savoir plus

Œil aiŒil ai

Œil ai

Robots sexuels, l’agent contracte un tueur à gages, des vagins artificiels: l’œil de l’IA se déchaîne

par Andrew Fenton
8 min
16 janvier 2025

L’agent AI prévoit l’assassinat sur Dark Web, les robots sociaux sont des robots sexuels, le prix du vagin artificiel, Brad Pitt Deepfakes et plus: AI Eye

En savoir plus





Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Please enter CoinGecko Free Api Key to get this plugin works.