題庫產(chǎn)品:粗粒度的個性化是偽個性化

上節(jié)說到題庫有兩類,一是以學(xué)霸君為代表的拍題產(chǎn)品,一是以猿題庫為代表的組題產(chǎn)品。組題產(chǎn)品給我的感覺是在做一個“活”的練習(xí)冊,“可以根據(jù)你對考點(diǎn)的掌握情況智能出題”。因?yàn)槲易约哼^去也搞過一點(diǎn)點(diǎn)大數(shù)據(jù),然后我自己用了用這個產(chǎn)品,覺得這個事情不太對。主要的問題有兩個,第一個是“先有雞還是先有蛋”。你要有大量的數(shù)據(jù)才可能訓(xùn)練出精準(zhǔn)的推送模型,可是你要足夠“智能”才可能有大量的學(xué)生使用你的產(chǎn)品。冷啟動問題怎么破?
在回答問題前我吐個槽。去年6月份的時候我參加了一個小沙龍,聽猿題庫的朋友說用戶量已經(jīng)接近300萬了,每天最活躍的時候是晚上十點(diǎn)多。我特別想吐槽的是,這個app有個選項(xiàng)默認(rèn)是打開的,叫做“每日答題提醒”(最新版本在“發(fā)現(xiàn)”里面)。它的作用是每天晚上十點(diǎn)半準(zhǔn)時打開app并用最大音量提醒你來做題吧,不管你當(dāng)時在什么別的app里面或者哪怕你手機(jī)調(diào)的是靜音……囧rz。到了7月份我聽說猿題庫拿了1500萬刀的C輪,10月份的時候我看到新聞?wù)f用戶數(shù)突破500萬,每周新增30萬。于是我明白了,冷啟動怎么破?有錢啊!嗯,有錢真的可以的,數(shù)據(jù)量這一局暫時你贏了。然后就是第二個問題了,數(shù)據(jù)質(zhì)量,給大家看兩張截圖。
感謝數(shù)學(xué)不好的小伙伴堅(jiān)持看完上面這一段,我想表達(dá)的觀點(diǎn)是——粗粒度的個性化是偽個性化。用俄羅斯方塊做個比喻,如圖,下面那些坑就是學(xué)生的薄弱點(diǎn)或者叫做用戶的需求,五花八門。現(xiàn)在你要消掉它,如果落下來的全是4×4甚至6×6的方塊,那你永遠(yuǎn)也別想成功。
回到上面題庫的第二個問題就是,任何數(shù)據(jù)所訓(xùn)練出來的模型的顆粒度不可能超過數(shù)據(jù)本身的顆粒度。所以,在數(shù)據(jù)質(zhì)量(顆粒度)達(dá)到某個閾值之前,再多的數(shù)據(jù)可能都是“廢的”,數(shù)據(jù)的質(zhì)量決定了個性化的有效性。
實(shí)際上,數(shù)據(jù)顆粒度這件事還間接影響了前一篇中我們提到的“學(xué)習(xí)主動性”問題。這里先賣個關(guān)子,回頭一并在學(xué)習(xí)主動性一節(jié)闡述。
市面上估計(jì)有十幾款題庫,有興趣的朋友可以都裝來看看,show出來的知識點(diǎn)基本都是上面截圖那種粒度的。然后就有個朋友跟我說“真像你說的那么多問題,人還拿了那么多錢呢”。對這個問題,我想起前幾個月有篇文章,講的是對比IDG和紅杉的投資,標(biāo)題是“賭選手還是賭賽道”之類的。這兩年在這個領(lǐng)域創(chuàng)業(yè)有兩個感覺,一是好像全行業(yè)都覺得所謂風(fēng)來了,他媽的再有個三五年,在線教育絕對是和電商之于傳統(tǒng)零售一樣,對傳統(tǒng)教育必須是顛覆??;二是至今都沒有一個能夠得到較廣泛認(rèn)可的模式或產(chǎn)品,尤其是K12。所以,第一點(diǎn)決定了資本必須布局,得投啊,晚了沒坑了啊。第二點(diǎn)是都不靠譜那投誰呢?其中一個答案就是“賭賽道”,越有錢越這么干。起碼最好的賽道要有我的份,然后每個賽道里面盡量挑最好的選手唄。猿題庫當(dāng)年也是做平臺(粉筆網(wǎng))的呢。2013年,多少平臺拿錢了呀,到2013年下半年就開始死了,粉筆網(wǎng)團(tuán)隊(duì)很棒啊,能夠快速轉(zhuǎn)型到第二波最靠譜的模式——題庫。然后各種題庫紛紛冒出來了,到現(xiàn)在題庫也開始泛濫了,那第三波最靠譜的在哪里?不知道,希望是我們哈。
其實(shí)組題類題庫還有一種,就是面向老師的,猿題庫是面向?qū)W生的。我個人其實(shí)比較喜歡面向老師的組題類產(chǎn)品??赡苁且?yàn)樽约鹤隽硕螘r間老師,覺得自動組卷這玩意真是有用啊。去年我們經(jīng)常用梯子網(wǎng)查題,可惜它倒了?,F(xiàn)在也有一些面向老師的組題產(chǎn)品,不過比較少。想來想去,面向老師的組題產(chǎn)品不能成為主流的原因可能是兩個,一是盤子小,二是商業(yè)模式不成立。面向?qū)W生的組題產(chǎn)品的商業(yè)模式,我理解核心是導(dǎo)流玩轉(zhuǎn)化率,通過對接其他環(huán)節(jié)完成整個閉環(huán)。用一個朋友的話講是,“給人特別互聯(lián)網(wǎng)的感覺”。對比起來,面向老師的就差的比較多了。這一塊因?yàn)橄氲牟欢?,就先不展開扯淡了。
今天拍了很多猿題庫,猿題庫的朋友不要打我哈。猿題庫是題庫里做的最棒的,我們也偷著學(xué)了點(diǎn)東西。比如公式的處理,latex串用的很棒,在存儲、傳輸和顯示等方面都有極大優(yōu)勢,還有很強(qiáng)的擴(kuò)展性,比起現(xiàn)在很多用圖片的那是高大上太多了。
FROM Techxue
說到底 其實(shí)就是推薦題庫的問題; 技術(shù)上好難解決啊…