DeepSeek

DeepSeek (Kichina: 深度求索; pinyin: Shēndù Qiúsuǒ) ni kampuni ya Kichina ya akili bandia inayotengeneza mifano mikubwa ya lugha (LLM) kwa mfumo huria. Makao yake yako Hangzhou, Zhejiang, na inamilikiwa na kuendeshwa na mfuko wa uwekezaji wa Kichina, High-Flyer, ambao mwanzilishi mwenza wake, Liang Wenfeng, aliianzisha mwaka 2023 na pia anahudumu kama Mkurugenzi Mtendaji wa kampuni hiyo.
DeepSeek inajulikana kwa kutekeleza kazi kwa kiwango sawa na ChatGPT, licha ya kuundwa kwa gharama ndogo sana na kutumia rasilimali chache zaidi. Kampuni ilianzisha mfano wake wa AI huku kukiwa na vikwazo vya Marekani dhidi ya China vya Nvidia chips, vilivyolenga kupunguza uwezo wa nchi hiyo kuendeleza mifumo ya juu ya AI.
Mnamo tarehe 10 Januari 2025, DeepSeek ilizindua programu ya kwanza ya mazungumzo ya chatbot bure, ambayo kufikia 27 Januari, ilikuwa imezidi ChatGPT kama programu ya bure iliyopakuliwa zaidi kwenye iOS App Store nchini Marekani. Hatua hii ilisababisha hisa za Nvidia kushuka kwa asilimia 18. Mafanikio ya DeepSeek dhidi ya washindani wakubwa na waliopo kwa muda mrefu yameelezwa kama "kuvuruga AI" na kuwa "hatua ya kwanza katika kile kinachoonekana kama mbio za kimataifa za AI[1][2][3]."
DeepSeek imetoa chatbot yake ya akili bandia ya kizazi kwa mfumo huria, ikimaanisha kuwa msimbo wake uko wazi kwa matumizi, marekebisho, na ukaguzi. Hii inajumuisha ruhusa ya kufikia na kutumia msimbo wa chanzo na nyaraka za muundo kwa ajili ya kujenga mifumo mingine. Kampuni pia huajiri watafiti wa AI vijana kutoka vyuo vikuu maarufu vya China na wataalamu kutoka nje ya uwanja wa sayansi ya kompyuta ili kupanua ujuzi na uwezo wa mifano yake[4] .
DeepSeek imeelezwa kama kiongozi anayebadilisha mazingira ya AI, ikichangia kile kinachotazamwa kama "mbio za anga za kimataifa za AI[5]."
Tanbihii
[hariri | hariri chanzo]- ↑ Guo, Daya; Zhu, Qihao; Yang, Dejian; Xie, Zhenda; Dong, Kai; Zhang, Wentao; Chen, Guanting; Bi, Xiao; Wu, Y. (2024-01-26), DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence, arXiv:2401.14196
- ↑ "DeepSeek Coder". deepseekcoder.github.io. Iliwekwa mnamo 2025-01-27.
- ↑ deepseek-ai/DeepSeek-Coder, DeepSeek, 2025-01-27, iliwekwa mnamo 2025-01-27
- ↑ Schneider, Jordan (27 Novemba 2024). "Deepseek: The Quiet Giant Leading China's AI Race". ChinaTalk (kwa Kiingereza). Iliwekwa mnamo 28 Desemba 2024.
{{cite web}}
: CS1 maint: date auto-translated (link) - ↑ "DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder". GitHub (kwa Kiingereza). Ilihifadhiwa kwenye nyaraka kutoka chanzo mnamo 22 Januari 2025. Iliwekwa mnamo 2025-01-24.
{{cite web}}
: CS1 maint: date auto-translated (link)
Viungo vya nje
[hariri | hariri chanzo]![]() |
Makala hii kuhusu mambo ya teknolojia bado ni mbegu. Je, unajua kitu kuhusu mada hiyo kama historia yake au mahusiano yake na mada nyingine? Labda unaona habari katika Wikipedia ya Kiingereza au lugha nyingine zinazofaa kutafsiriwa? Basi unaweza kuisaidia Wikipedia kwa kuihariri na kuongeza habari. |