題庫產(chǎn)品:粗粒度的個性化是偽個性化

包子哥
1 評論 18401 瀏覽 40 收藏 9 分鐘
🔗 技术知识、行业知识、业务知识等,都是B端产品经理需要了解和掌握的领域相关的知识,有助于进行产品方案设计和评估

上節(jié)說到題庫有兩類,一是以學(xué)霸君為代表的拍題產(chǎn)品,一是以猿題庫為代表的組題產(chǎn)品。組題產(chǎn)品給我的感覺是在做一個“活”的練習(xí)冊,“可以根據(jù)你對考點(diǎn)的掌握情況智能出題”。因?yàn)槲易约哼^去也搞過一點(diǎn)點(diǎn)大數(shù)據(jù),然后我自己用了用這個產(chǎn)品,覺得這個事情不太對。主要的問題有兩個,第一個是“先有雞還是先有蛋”。你要有大量的數(shù)據(jù)才可能訓(xùn)練出精準(zhǔn)的推送模型,可是你要足夠“智能”才可能有大量的學(xué)生使用你的產(chǎn)品。冷啟動問題怎么破?

在回答問題前我吐個槽。去年6月份的時候我參加了一個小沙龍,聽猿題庫的朋友說用戶量已經(jīng)接近300萬了,每天最活躍的時候是晚上十點(diǎn)多。我特別想吐槽的是,這個app有個選項(xiàng)默認(rèn)是打開的,叫做“每日答題提醒”(最新版本在“發(fā)現(xiàn)”里面)。它的作用是每天晚上十點(diǎn)半準(zhǔn)時打開app并用最大音量提醒你來做題吧,不管你當(dāng)時在什么別的app里面或者哪怕你手機(jī)調(diào)的是靜音……囧rz。到了7月份我聽說猿題庫拿了1500萬刀的C輪,10月份的時候我看到新聞?wù)f用戶數(shù)突破500萬,每周新增30萬。于是我明白了,冷啟動怎么破?有錢啊!嗯,有錢真的可以的,數(shù)據(jù)量這一局暫時你贏了。然后就是第二個問題了,數(shù)據(jù)質(zhì)量,給大家看兩張截圖。

??

注意圖中的“考點(diǎn)”和“標(biāo)簽”,機(jī)器是不認(rèn)識“題目”的,機(jī)器學(xué)習(xí)的數(shù)據(jù)就是這些人工打上的“標(biāo)簽”?,F(xiàn)在的題庫動輒號稱千萬題量,其實(shí)哪怕是百萬,生產(chǎn)一個上圖這樣標(biāo)準(zhǔn)化的題庫的唯一辦法就是雇傭大量的廉價勞動力,比如大學(xué)生兼職團(tuán)隊(duì)。在這種情況下,你打出來的標(biāo)只能是“粗粒度”的?!按至6取痹趺蠢斫??大家都學(xué)過中學(xué)數(shù)學(xué)的,我們嘗試估計(jì)一下這種標(biāo)簽的種類數(shù)量。整個高中數(shù)學(xué)約30個單元,如數(shù)列、立體幾何、函數(shù)、不等式等。按照“等差數(shù)列、等比數(shù)列”、“定義法”、“空間幾何體”、“圖解法”這樣的用詞,每個單元平均十幾個標(biāo)簽吧,總數(shù)我猜在300個左右。好,我們來感受一下這樣一個場景,智能題庫給你推送了5道題,都帶有“直線方程”這個標(biāo)簽,結(jié)果你全做錯了。這時不管背后的機(jī)器怎么學(xué)習(xí),它一定要再給你推一道帶“直線方程”標(biāo)簽的題吧。這有用嗎?你剛才犯的錯誤是“用點(diǎn)斜式設(shè)直線方程時忘記考慮斜率K不存在的情況”,或者是忘記了“與直線Ax+By+C=0垂直的直線是Bx-Ay+C1=0 (C1≠C)”,再或者是在“用方法四求直線關(guān)于某定點(diǎn)對稱的直線”時用錯了“中點(diǎn)坐標(biāo)公式”,blablabla……然后這次給你推的題是“求兩條直線的交點(diǎn)坐標(biāo)”。嗯,它們都是“直線方程”。

感謝數(shù)學(xué)不好的小伙伴堅(jiān)持看完上面這一段,我想表達(dá)的觀點(diǎn)是——粗粒度的個性化是偽個性化。用俄羅斯方塊做個比喻,如圖,下面那些坑就是學(xué)生的薄弱點(diǎn)或者叫做用戶的需求,五花八門。現(xiàn)在你要消掉它,如果落下來的全是4×4甚至6×6的方塊,那你永遠(yuǎn)也別想成功。

?002-1

回到上面題庫的第二個問題就是,任何數(shù)據(jù)所訓(xùn)練出來的模型的顆粒度不可能超過數(shù)據(jù)本身的顆粒度。所以,在數(shù)據(jù)質(zhì)量(顆粒度)達(dá)到某個閾值之前,再多的數(shù)據(jù)可能都是“廢的”,數(shù)據(jù)的質(zhì)量決定了個性化的有效性。

實(shí)際上,數(shù)據(jù)顆粒度這件事還間接影響了前一篇中我們提到的“學(xué)習(xí)主動性”問題。這里先賣個關(guān)子,回頭一并在學(xué)習(xí)主動性一節(jié)闡述。

市面上估計(jì)有十幾款題庫,有興趣的朋友可以都裝來看看,show出來的知識點(diǎn)基本都是上面截圖那種粒度的。然后就有個朋友跟我說“真像你說的那么多問題,人還拿了那么多錢呢”。對這個問題,我想起前幾個月有篇文章,講的是對比IDG和紅杉的投資,標(biāo)題是“賭選手還是賭賽道”之類的。這兩年在這個領(lǐng)域創(chuàng)業(yè)有兩個感覺,一是好像全行業(yè)都覺得所謂風(fēng)來了,他媽的再有個三五年,在線教育絕對是和電商之于傳統(tǒng)零售一樣,對傳統(tǒng)教育必須是顛覆??;二是至今都沒有一個能夠得到較廣泛認(rèn)可的模式或產(chǎn)品,尤其是K12。所以,第一點(diǎn)決定了資本必須布局,得投啊,晚了沒坑了啊。第二點(diǎn)是都不靠譜那投誰呢?其中一個答案就是“賭賽道”,越有錢越這么干。起碼最好的賽道要有我的份,然后每個賽道里面盡量挑最好的選手唄。猿題庫當(dāng)年也是做平臺(粉筆網(wǎng))的呢。2013年,多少平臺拿錢了呀,到2013年下半年就開始死了,粉筆網(wǎng)團(tuán)隊(duì)很棒啊,能夠快速轉(zhuǎn)型到第二波最靠譜的模式——題庫。然后各種題庫紛紛冒出來了,到現(xiàn)在題庫也開始泛濫了,那第三波最靠譜的在哪里?不知道,希望是我們哈。

其實(shí)組題類題庫還有一種,就是面向老師的,猿題庫是面向?qū)W生的。我個人其實(shí)比較喜歡面向老師的組題類產(chǎn)品??赡苁且?yàn)樽约鹤隽硕螘r間老師,覺得自動組卷這玩意真是有用啊。去年我們經(jīng)常用梯子網(wǎng)查題,可惜它倒了?,F(xiàn)在也有一些面向老師的組題產(chǎn)品,不過比較少。想來想去,面向老師的組題產(chǎn)品不能成為主流的原因可能是兩個,一是盤子小,二是商業(yè)模式不成立。面向?qū)W生的組題產(chǎn)品的商業(yè)模式,我理解核心是導(dǎo)流玩轉(zhuǎn)化率,通過對接其他環(huán)節(jié)完成整個閉環(huán)。用一個朋友的話講是,“給人特別互聯(lián)網(wǎng)的感覺”。對比起來,面向老師的就差的比較多了。這一塊因?yàn)橄氲牟欢?,就先不展開扯淡了。

今天拍了很多猿題庫,猿題庫的朋友不要打我哈。猿題庫是題庫里做的最棒的,我們也偷著學(xué)了點(diǎn)東西。比如公式的處理,latex串用的很棒,在存儲、傳輸和顯示等方面都有極大優(yōu)勢,還有很強(qiáng)的擴(kuò)展性,比起現(xiàn)在很多用圖片的那是高大上太多了。

FROM Techxue

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 說到底 其實(shí)就是推薦題庫的問題; 技術(shù)上好難解決啊…

    來自上海 回復(fù)
专题
15283人已学习12篇文章
本专题的文章分享了用户精细化运营---用户分群的建立指南。
专题
35631人已学习18篇文章
好的数据分析可以使我们的产品不断优化,而做好数据分析的第一步就是做好数据埋点。
专题
17308人已学习14篇文章
本专题的文章分享了如何设计B端SaaS产品及B端SaaS产品方法论。
专题
15635人已学习12篇文章
运费是电商的基础功能模块之一,承担着商品运费计算的作用。本专题的文章分享了如何设计运费规则。
专题
13515人已学习15篇文章
私域流量是与公域流量相对的概念,本专题的文章主要通过几个核心的问题,为大家解读私域流量背后的底层逻辑。
专题
19757人已学习18篇文章
物流仓储系统是实现物流高效运转的基础。本专题的文章提供了物流仓储系统设计指南。