【直播回顧】普通開發者如何玩AI
原創本篇目錄
随着软件开发技术的不断迭代升级,AI逐渐成为开发者最为关注的方向。AI技术不再是遥不可及的高科技,作为一名普通开发者,怎样让AI技术更好地为我们所用呢?本期践行者邀请到了Gitee AI技术专家林家桢老師和开源中国CTO红薯老师,一起看看他们如何教我们“玩转”AI。
一、直播實錄
Q1:開發者需要了解哪些AI的知識點?
林家桢老師:
可以抓住AI技術關鍵詞。當下最熱門的技術是圍繞Transformer構建的一系列技術,這是一個關鍵詞,抓住Transformer可以往不同方向找到更多技術、應用、場景相關的關鍵詞。
作爲一名開發者,可以抓住關鍵詞和關鍵詞的組合在平台社區檢索信息,獲取AI相關的知識。我們可以看到在開源社區中已經有很多廣泛的嘗試。通過善用搜索引擎,我們可以有很多不同領域的想法,這些想法其實會反過來激發我們産生新的靈感。
Q2:開發者可通過何種渠道低成本體驗AI開發?
紅薯老師:
大模型其实在笔记本上都跑得起来,而且现在有很多开源小工具,包括最开始的ChatGPT以及百度、清华的一些免费Chat 应用。
就AI Chat 的应用,我认为如果大家对 AI完全没有任何基础的话,可以先去使用、感受一下,这与以往所认识的AI是完全不一样的。我们过去主要做人脸识别,大家可能对此非常熟悉,但现在AI 的应用能力与以往完全不同,因此可以去感受一下AI能力。
在這個階段,我們可以開始思考:AI和我目前的工作、業務會有哪些結合點。例如,我們可以開發一個博客應用,讓AI輔助生成部分博客內容。在初期階段可以進行探索,一旦業務初具模型,接下來的關鍵問題並不在于技術的具體運用,或是通過簡單的方式在機器上去運行一些開源模型,更關鍵的問題在于如何將AI能力與我的業務有機結合。這是一個需要從業務角度思考的問題。
Q3:普通開發者如何向AI轉型?
紅薯老師:
對于AI開發,更多人是從入門到放棄的狀態,因爲這裏牽扯到各個方面的知識。對于AI應用的開發,我認爲要感知業界在做什麽,找到適合自己的領域切入,這樣才能做出自己有特色的應用。
林家桢老師:
我認爲可以結合自身業務需求來看這個問題。這可能需要開發者先了解現在AI水平,而只是依賴新聞報道,可以實際去了解當前項目的進展。在開源生態中會有同行之間的review,所以report的置信度會高一些。這是開源生態中很重要的一點,與學術的同行評議類似。
在开源领域,当我们开源自己的项目、的算法和展示自己的AI 能力时,这些相对更具有落地意义。我们在开源生态中接触AI的应用,了解具体应用领域,再回头审视自身业务,看看我们有哪些机会可以应用到这些技术,然后做一些落地的尝试。
现在有很多可以尝试的点。在我们团队中,有一些小伙伴很喜欢二次元和虚拟人物。目前,虚拟人物的动画形象通常由人类扮演者控制,通过动作捕捉技术捕捉人物的face structure,再展示虚拟人物形象进行直播。然而,有一种新的应用方式,利用Chat机器人构建一个专属的虚拟人物,它能够直接和你对话。这实际上是一个大模型,也是一个很有意思的应用。在开源社区上,还没有人完整地落地这件事。
因此,可以看到有很多类似的结合存在。不仅局限于知识库、問答、总结和摘要,而是可以将其与业务需求和个人兴趣结合起来。其实还有很多尚待挖掘点可以做。
Q4:前端開發人員應該學習AI的什麽方向?
我了解在Hugging Face上开发AI应用时,通常会使用Python编程方法,而Python有专门的库用于构建用户界面(UI),但我觉得这种方式相当繁琐,因为我发现学习这方面的知识相当费力。
我一直想做的事情是讓未來的AI應用可以利用當前流行的技術。比如說,通過調用API的方式,結合現有的前端技術,就能打造全新的AI應用。這樣一來,整體體驗會更加出色,用戶感受也會更好。因爲目前前端技術生態非常成熟,與Python生態完全不在一個層次上。
因此,我们希望未来的AI Chat能够幫助前端開發者快速构建AI应用。这样一来,门槛将大大降低,使得开发变得更加便捷。
Q5:大模型的開源和閉源之爭,開發者如何選擇?
紅薯老師:
去年6 月,我们曾专门做了一次关于大模型的开源与闭源的讨论。
以下是大家爭論得比較激烈的點:
- 現在開源的大模型是否真的開源;
- 開源的大模型是否會越做越差。
“開源”這個詞到現在已有幾十年了,其定義早在很久以前就提出了。現在AI大模型是在短短一兩年內嶄露頭角的。大模型的“開源”的確不符合傳統開源的官方定義,所以它的確不算是嚴格意義上的開源。許多訓練過程和數據都未公開,當前的開源大模型更多類似于以往我們所謂的共享軟件或自由軟件,即提供的是二進制版本。
如果有人重新定義“開源”,可能會更符合當前AI的發展趨勢。目前,各方紛紛推出各種開源大模型,基本上已經偏離了傳統開源定義的道路。
林家桢老師:
我更加关注基准测试(Benchmark )。我们首先要确立评估标准,再根据不同规模来评判模型的好坏。在学术价值观方面,GPT4 最新版本的评分毫无疑问是最高的,其与人的互动表现最佳。但在实际落地应用中,确定哪种模型更好并不是一件简单的事情,因为我们缺乏一个能够适用于所有场景的评估体系和标准。
所以,在實際落地項目時,我們通常會先利用OpenAI運行一個比較好的狀態,再通過在線推理,將其應用于實際場景並測試效果。如果效果好,確定該場景可行後,我們會將這個開源模型稍作縮小以便本地化部署,隨後在該場景中進行進一步的調優和應用。
從技術角度來看,大模型應用大致分爲三個階段:
- 第一個階段:預訓練大模型,需要投入大量資金,可以由個人開發者或者開源生態實現;
- 第二個階段,精細化調整階段(FIN);
- 第三個階段:promotion,即給模型指令,這是模型落地部署的比較關鍵的階段,更接近于開源生態,就像是軟件工程的開源。
Q6:企業想用AI賦能應如何做?
紅薯老師:
- 積極擁抱
- 公司鼓勵的氛圍很重要
對于公司的領導者來說,鼓勵大家去嘗試這種探索是最重要的,而不是關注具體的結合點。我認爲同事們可能有著創造性的思維,會提出更多結合的好點子。
林家桢老師:
AI賦能是一件挺難的事情,需要小夥伴對自身業務有著深刻的了解。目前,更多的有關AI信息輸入是必要的,以明確AI當前的能力邊界。
可以從多個層次了解AI能力:學術、大類應用、具體AI項目。其中AI的應用項目似乎已經開始出圈了,不僅是在Gitee等平台,在許多娛樂向內容網站也出現了不少。開發者門都有自己的創意,也願意分享自己的idea與demo,我認爲這種分享往往能激發更多的靈感。
Q7:有了 AI,传统软件开发的工作模式会发生变化吗?程序员会失业吗?
紅薯老師:
我現在還在寫代碼,對于AI提效真的深有感觸。利用現有的一些AI編程工具確實可以提升工作效率。相比以往需要進行搜索的情況,現在很多時候AI會自動給出答案,並根據上下文給出代碼的建議。
这里的两个问题:一个是现状,另一个是趋势。那我们是否认可“程序员会AI替代”这一趋势呢?AI肯定会不断提升,当它提升到了40%、50% 时,可能会波及到一些比较低阶的程序员。但就当前阶段而言,AI替代程序员不太现实,甚至完全不太可能。我相信以后会有更多人在这方面取得进展,但要完全取代程序员的工作应该没有那么容易。
林家桢老師:
Q8:現在有哪些工AI具可以運用到開發中?
紅薯老師:
我举个例子,我目前正在安排Gitee接入一个AI工具。大家经常会在Gitee、GitHub 这样的网站上看开源项目和源码。那我就想利用AI,可以在查看代码时为开发者展示代码的解读。这会用到给Gitee AI上面的算力来做提供,我认为这可能是一个很小很小的点,但是挺有意思,这就是不断地去尝试探索。
林家桢老師:
我是从事系统开发方面工作,通常一个工程文件可能长达6000多行。如果我要理解核心,需要花大量时间在不同的代码段里跳来跳去的。如果有AI 直接帮我做出总结和摘要,指出核心功能和核心函数,这会大大降低代码阅读的成本。
我非常想實現這個功能。我認爲現有的AI已經能夠實現我剛剛所描述的場景。但是在不清楚業務場景時,其實很難將其落地。
紅薯老師:
開發者在看各種各樣的項目時,需要一個快速的指引。一般情況下,他們會在線查看開源項目,只有遇到真正感興趣的項目才會拉到本地跑一跑,所以說這個量還是蠻大的。
AI需要一定门槛。无论是租赁服務器、购买硬件还是使用云服務,成本都相对较高。此外,使用量大的情况下,比如 Gitee,成本可能会令人望而却步。我们需要评估所需的算力支持,以完成这一项目。
此前,我曾考虑另一个问题。在提交代码时,例如为开源项目做贡献或提交 PR,常常需要编写大量描述内容,包括标题、简介以及解决的问题。程序员普遍不喜欢编写文档,甚至会批评他人不编写文档。这是程序员的共同特点。因此,我们是否可以借助AI来生成这些 PR 的描述信息以提高效率。
林家桢老師:
我做AI Serverless系统做得比较多,但在应用层面却缺乏灵感。刚提到虚拟数字人的应用时,我想到了一个需求,即希望它能够帮我生成单元测试。单元测试通常是程序员不太喜欢编写的内容之一。
我们有一个企业数据处理的应用场景。现在企业中有许多数字资料数据,期望可以有效利用。但由于这些数据并非总是结构化的,传统的 OCR 等自动化文字识别工具往往无法取得较好的效果。例如,说明书是为人设计的,其排版对于OCR工具而言非常复杂。这时就可以利用多模态大型模型的视觉能力,让大模型阅读说明书,结构化地输出说明书的主要内容,以此完成非结构化数据的结构化工作。我们在Gitee AI上分享了这一应用。
Q9:開源中國的運營成本高嗎?
紅薯老師:
其实,开源中国的運營成本很低,很长一段时间是靠一台机器支撑整个网站的流量,即使发展到现在,服務器数量也不过三五台,所以说费用挺低的。相比之下,Gitee的规模相当庞大,目前拥有超过 500 台服務器,用以支撑国内1200万开发者的需求。
随之推出的Gitee AI更恐怖。当前AI技术所需的硬件设备價格昂贵,一台机器可能高达200 万。我们希望未来AI应用开发者能够更便捷地在AI平台上选择模型,并在我们提供的服務上运行这些模型,以提高效率。
Q10:AI未來將走向何方?
紅薯老師:
我認爲未來是一個AI應用大放異彩的時代。現在大家把焦點都放在研究和開發這一“煉丹”的過程,但這些“丹藥”到底誰來吃還是未知的。目前,大家都只是舔一舔,還沒敢大口嘗試。所以說,未來應該是一個AI應用蓬勃發展的最佳時期,現在也是一個合適的起步時機。
林家桢老師:
三、送給大家的一句話
林家桢老師:
希望各位開發者在AI時代用好AI。
紅薯老師:
该吃的饭还是得吃,这些是AI 帮不了你的。
-
禅道産品
禅道開源版 禅道企業版 禅道旗艦版 禅道IPD版 -
核心功能
産品管理 項目管理 質量管理 效能管理 -
使用文檔
基本版手冊 企業版手冊 旗艦版手冊 IPD版手冊 開發中心手冊 -
幫助中心
积分問答 常見問題 論壇交流 使用視頻 Gitee GitHub -
關于我們
關于我們 禅道軟件 最新動態 禅道活動 -
禅道社區
禅道博客 積分排行 積分商城 禅道書院 -
聯系方式
聯系人:魏中顯 電話:18561939726 微信:18561939726 Q Q:1746749398北京、上海、深圳分部