Deepseek-R1 Combinând AI și Calculul Edge pentru IoT industrial

Introducere

Modelele distilate de dimensiuni mici de DeepSeek-R1 sunt reglate bine folosind date de lanț de gândire generate de DeepSeek-R1, marcate cu...Etichete, moștenind capacitățile de raționament ale R1. Aceste seturi de date reglate fine includ în mod explicit procese de raționament, cum ar fi descompunerea problemelor și deduceri intermediare. Învățarea de consolidare a aliniat modelele de comportament ale modelului distilat cu etapele de raționament generate de R1. Acest mecanism de distilare permite modelelor mici să mențină eficiența de calcul, obținând în același timp abilități complexe de raționament în apropierea celor ale modelelor mai mari, ceea ce are o valoare semnificativă a aplicării în scenarii constrânse de resurse. De exemplu, versiunea 14B realizează 92% din finalizarea codului modelului original DeepSeek-R1. Acest articol introduce modelul distilat DeepSeek-R1 și aplicațiile sale de bază în calcularea marginilor industriale, rezumate în următoarele patru direcții, împreună cu cazuri specifice de implementare:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Întreținerea predictivă a echipamentelor

Implementare tehnică

Fuziunea senzorului:

Integrați vibrațiile, temperatura și datele curente din PLC prin protocolul Modbus (viteza de eșantionare 1 kHz).

Extragerea caracteristicilor:

Run Edge Impulse pe Jetson Orin NX pentru a extrage caracteristici ale serii de timp de 128 de dimensiuni.

Inferența modelului:

Implementați modelul Deepseek-R1-Distill-14B, vectori de caracteristici de intrare pentru a genera valori de probabilitate de eroare.

Reglare dinamică:

Declanșarea lucrărilor de întreținere comenzi atunci când încrederea> 85%și inițiați un proces de verificare secundar atunci când <60%.

Caz relevant

Schneider Electric a implementat această soluție pe utilaje miniere, reducând ratele false pozitive cu 63% și costurile de întreținere cu 41%.

1

Rularea modelului distilat Deepseek R1 pe computere AI Edge Inhand

Inspecție vizuală îmbunătățită

Arhitectură de ieșire

Conductă tipică de implementare:

Cameră = gige_vision_camera (500fps) # Cameră industrială Gigabit
Frame = Camera.Capture () # Imagine de captare
preprocesat = OpenCV.denoise (cadru) # Denoising Preprocessing
Defect_type = Deepseek_R1_7B.infer (preprocesat) # Clasificarea defectelor
Dacă defect_type! = 'normal':
PLC.Trigger_Reject () # Mecanismul de sortare a declanșării

Valorile de performanță

Întârziere de procesare:

82 ms (Jetson Agx Orin)

Precizie:

Detectarea defectelor modelate prin injecție ajunge la 98,7%.

2

Implicațiile Deepseek R1: câștigători și învinși în lanțul valoric AI generativ

Optimizarea fluxului de proces

Tehnologii cheie

Interacțiunea limbajului natural:

Operatorii descriu anomaliile echipamentului prin voce (de exemplu, „Fluctuația presiunii extruderului ± 0,3 MPa”).

Raționament multimodar:

Modelul generează sugestii de optimizare bazate pe date istorice ale echipamentelor (de exemplu, reglarea vitezei șurubului cu 2,5%).

Verificare digitală Twin:

Validarea simulării parametrilor pe platforma Edgex Foundry.

Efect de implementare

Uzina chimică a BASF a adoptat această schemă, obținând o reducere de 17% a consumului de energie și o creștere de 9% a ratei calității produsului.

3

Edge AI și Viitorul afacerilor: OpenAI O1 vs. Deepseek R1 pentru asistență medicală, automobile și IIOT

Recuperarea instantanee a bazei de cunoștințe

Proiectare arhitectură

Baza de date vectorială locală:

Utilizați CHROMADB pentru a stoca manuale de echipamente și specificațiile procesului (Embedding Dimension 768).

Recuperare hibridă:

Combinați algoritmul BM25 + Asemănarea cosinusului pentru interogare.

Generarea rezultatelor:

Modelul R1-7B rezumă și rafinează rezultatele de recuperare.

Caz tipic

Inginerii Siemens au rezolvat defecțiunile invertorului prin interogările de limbaj natural, reducând timpul mediu de procesare cu 58%.

Provocări și soluții de implementare

Limitări de memorie:

A utilizat tehnologia de cuantificare a cache -ului KV, reducând utilizarea memoriei modelului 14B de la 32 GB la 9 GB.

Asigurarea performanței în timp real:

Latența de inferență unică stabilizată la ± 15 ms prin optimizarea graficului CUDA.

Model Drift:

Actualizări incrementale săptămânale (transmitând doar 2% din parametri).

Medii extreme:

Proiectat pentru intervale de temperatură largi de -40 ° C până la 85 ° C cu nivel de protecție IP67.

5
微信图片 _20240614024031.jpg1

Concluzie

Costurile actuale de implementare au scăzut acum la 599 USD/nod (Jetson Orin NX), cu aplicații scalabile formând în sectoare precum fabricația 3C, asamblarea auto și chimia energiei. Optimizarea continuă a tehnologiei de arhitectură și cuantificare MOE este de așteptat să permită modelului 70B să funcționeze pe dispozitivele de margine până la sfârșitul anului 2025.

Găsiți soluția de cablu ELV

Cabluri de control

Pentru BMS, autobuz, industrial, cablu de instrumentare.

Sistem de cablare structurată

Rețea și date, cablu cu fibră optică, cablu de plasture, module, placă de față

2024 Expoziții și evenimente de recenzie

18 aprilie-18, 2024-energie mijlocie în Dubai

18-16 aprilie, 2024 Securika la Moscova

9 mai, 2024 Eveniment de lansare de produse și tehnologii noi în Shanghai

22 octombrie, 2024 Securitate China la Beijing

Nov.19-20, 2024 Conectat World KSA


Timpul post: februarie-07-2025