DeepSeek-R1 combină inteligența artificială și Edge Computing pentru IoT industrial

Introducere

Modelele distilate de dimensiuni mici ale DeepSeek-R1 sunt ajustate fin folosind date de tip lanț de gândire generate de DeepSeek-R1, marcate cu...etichete, moștenind capacitățile de raționament ale R1. Aceste seturi de date fin reglate includ în mod explicit procese de raționament, cum ar fi descompunerea problemelor și deducțiile intermediare. Învățarea prin consolidare a aliniat tiparele de comportament ale modelului distilat cu pașii de raționament generați de R1. Acest mecanism de distilare permite modelelor mici să mențină eficiența computațională, obținând în același timp abilități complexe de raționament apropiate de cele ale modelelor mai mari, ceea ce are o valoare aplicativă semnificativă în scenarii cu resurse limitate. De exemplu, versiunea 14B realizează 92% din finalizarea codului modelului original DeepSeek-R1. Acest articol prezintă modelul distilat DeepSeek-R1 și aplicațiile sale principale în edge computing industrial, rezumate în următoarele patru direcții, împreună cu cazuri specifice de implementare:

dc3c637c5bead8b62ed51b6d83ac0b4

Întreținerea predictivă a echipamentelor

Implementare tehnică

Fuziunea senzorilor:

Integrați date despre vibrații, temperatură și curent de la PLC-uri prin protocolul Modbus (rată de eșantionare de 1 kHz).

Extragerea caracteristicilor:

Rulați Edge Impulse pe Jetson Orin NX pentru a extrage caracteristici ale seriilor temporale de 128 de dimensiuni.

Inferența modelului:

Implementați modelul DeepSeek-R1-Distill-14B, introducând vectori de caracteristici pentru a genera valori ale probabilității de defect.

Ajustare dinamică:

Declanșați comenzile de întreținere când încrederea este > 85% și inițiați un proces de verificare secundară când este < 60%.

Caz relevant

Schneider Electric a implementat această soluție pe utilajele miniere, reducând ratele de rezultate fals pozitive cu 63% și costurile de întreținere cu 41%.

1

Rularea modelului distilat DeepSeek R1 pe computere InHand AI Edge

Inspecție vizuală îmbunătățită

Arhitectura de ieșire

Canal de implementare tipic:

camera = GigE_Vision_Camera(500fps) # Cameră industrială Gigabit
frame = camera.capture() # Capturează imaginea
preprocesat = OpenCV.denoise(frame) # Preprocesare eliminare zgomot
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Clasificarea defectelor
dacă tipul_defectului != 'normal':
PLC.trigger_reject() # Declanșează mecanismul de sortare

Indicatori de performanță

Întârziere de procesare:

82 ms (Jetson AGX Orin)

Precizie:

Detectarea defectelor turnate prin injecție atinge 98,7%.

2

Implicațiile DeepSeek R1: Câștigători și perdanți în lanțul valoric al inteligenței artificiale generative

Optimizarea fluxului de proces

Tehnologii cheie

Interacțiune în limbaj natural:

Operatorii descriu anomaliile echipamentelor prin voce (de exemplu, „Fluctația presiunii extruderului ±0,3 MPa”).

Raționament multimodal:

Modelul generează sugestii de optimizare pe baza datelor istorice ale echipamentului (de exemplu, ajustarea vitezei șurubului cu 2,5%).

Verificare gemen digital:

Validarea simulării parametrilor pe platforma EdgeX Foundry.

Efectul implementării

Combinatul chimic BASF a adoptat această schemă, reușind o reducere de 17% a consumului de energie și o creștere de 9% a ratei calității produselor.

3

Inteligența artificială de la margine și viitorul afacerilor: OpenAI o1 vs. DeepSeek R1 pentru sănătate, industria auto și IIoT

Recuperare instantanee a bazei de cunoștințe

Design de arhitectură

Bază de date vectorială locală:

Folosește ChromaDB pentru a stoca manualele echipamentelor și specificațiile procesului (dimensiunea de încorporare 768).

Recuperare hibridă:

Combină algoritmul BM25 + similaritatea cosinusului pentru interogare.

Generarea rezultatelor:

Modelul R1-7B rezumă și rafinează rezultatele regăsirii.

Caz tipic

Inginerii Siemens au rezolvat defecțiunile invertoarelor prin interogări în limbaj natural, reducând timpul mediu de procesare cu 58%.

Provocări și soluții de implementare

Limitări de memorie:

A utilizat tehnologia de cuantizare KV Cache, reducând utilizarea memoriei modelului 14B de la 32 GB la 9 GB.

Asigurarea performanței în timp real:

Latența inferenței unice a fost stabilizată la ±15 ms prin optimizarea graficului CUDA.

Derivația modelului:

Actualizări incrementale săptămânale (transmiterea a doar 2% din parametri).

Medii extreme:

Proiectat pentru intervale largi de temperatură de la -40°C la 85°C, cu nivel de protecție IP67.

5
微信图片_20240614024031.jpg1

Concluzie

Costurile actuale de implementare au scăzut acum la 599 USD/nod (Jetson Orin NX), cu aplicații scalabile care se formează în sectoare precum producția 3C, asamblarea auto și chimia energetică. Se așteaptă ca optimizarea continuă a arhitecturii MoE și a tehnologiei de cuantizare să permită rularea modelului 70B pe dispozitive edge până la sfârșitul anului 2025.

Găsiți soluții de cablu ELV

Cabluri de control

Pentru BMS, BUS, industrial, cablu de instrumentație.

Sistem de cablare structurată

Rețea și date, cablu cu fibră optică, cablu de conectare, module, placă frontală

Recenzie Expoziții și Evenimente 2024

16-18 aprilie 2024, evenimentul „Energie în Orientul Mijlociu” din Dubai

16-18 aprilie 2024, Securika la Moscova

9 mai 2024 EVENIMENT DE LANSARE DE NOI PRODUSE ȘI TEHNOLOGII la Shanghai

22-25 octombrie 2024 SECURITY CHINA la Beijing

19-20 noiembrie 2024, CONNECTED WORLD KSA


Data publicării: 07 februarie 2025