<input id="yuqso"></input>
<pre id="yuqso"><cite id="yuqso"></cite></pre>
<acronym id="yuqso"><cite id="yuqso"></cite></acronym>
  • <s id="yuqso"><em id="yuqso"></em></s>
      <s id="yuqso"><em id="yuqso"></em></s>
      <bdo id="yuqso"></bdo>

      查詢速度最高提升50倍!火山引擎ByteHouse在廣告投放領(lǐng)域?qū)嵺`分享

      據(jù)QuestMobile報告顯示,移動互聯(lián)網(wǎng)已經(jīng)進入了下半場,在使用人數(shù)和使用時長方面已經(jīng)沒有明顯增長,互聯(lián)網(wǎng)已經(jīng)流量趨于飽和。

      作為廣告投放主要陣地,由于互聯(lián)網(wǎng)平臺流量紅利逐漸消退,越來越多的廣告企業(yè)和從業(yè)者開始探索精細化營銷的新路徑,取代以往的全流量、粗放式的廣告轟炸。精細化營銷意味著要在數(shù)以億計的人群中優(yōu)選出那些最具潛力的目標(biāo)受眾,這無疑對提供基礎(chǔ)引擎支持的數(shù)據(jù)倉庫能力,提出了極大的技術(shù)挑戰(zhàn)。


      (資料圖)

      在人群圈選分析中, 分析師一般利用各種標(biāo)簽組合,挑選出最合適的人群,進而完成廣告推送,達到精準(zhǔn)投放的效果。但由于人群查詢在不同標(biāo)簽組合下的結(jié)果集大小不同,在一次廣告投放中,分析師需要經(jīng)過多次的邏輯調(diào)整,以獲得"最好"的人群包。抖音集團擁有廣泛的廣告投放場景,在日常實踐中,我們發(fā)現(xiàn)以下痛點問題:

      ●首先,數(shù)據(jù)預(yù)估。廣告主需要對選定的人群組合進行預(yù)估,以便判斷投放情況并確定投放預(yù)算。但廣告平臺用戶越來越多,有的平臺DAU達到上億,使得人群包數(shù)據(jù)量過大,技術(shù)上只能采用1/10抽樣存儲,將導(dǎo)致10%誤差。

      ●其次,性能問題。為了保證人群圈選精準(zhǔn)度,廣告主往往會設(shè)定多樣、復(fù)雜的人群圈選條件,導(dǎo)致底層計算邏輯復(fù)雜,比如單次計算可能包含幾百,甚至上千個人群包。Hive和Elasticsearch等方案在處理大數(shù)據(jù)量時,查詢速度慢。如果研發(fā)人員查詢某個廣告主的所有用戶,該方案需要掃描整個用戶庫,整個過程需要幾分鐘甚至幾個小時,無法滿足廣告主實時性要求。

      ●最后,存儲問題。Hive和Elasticsearch等方案需要額外的索引結(jié)構(gòu),使得存儲空間變大,導(dǎo)致成本增加。

      在以往,研發(fā)團隊通常使用兩種方案來解決以上問題:

      方案一:將每個人群包存儲為一個Array類型的數(shù)據(jù)結(jié)構(gòu),每次查詢需要從Array中找到某一個特定ID。

      方案二:使用一個表來存儲用戶ID,在查詢的時使用In/Join計算多個人群的交集。

      經(jīng)過內(nèi)部長期使用經(jīng)驗,無論是方案一或方案二,都存在當(dāng)數(shù)據(jù)量逐漸增大,查詢速度無法滿足實時分析需求的問題。基于高性能、分布式特點,ClickHouse可以滿足大規(guī)模數(shù)據(jù)的分析和查詢需求,因此研發(fā)團隊以開源ClickHouse為基礎(chǔ),研發(fā)出火山引擎云原生數(shù)據(jù)倉庫ByteHouse,并在其中定制一套處理模型——BitEngine,用于解決集合的交并補計算在實時分析場景中的性能提升問題。

      據(jù)介紹,BitEngine是一個高效集合數(shù)據(jù)處理模型,底層基于MergeTree Family存儲引擎,并在此基礎(chǔ)上引入了BitMap64類型,開發(fā)了系列相關(guān)運算函數(shù)。BitEngine提供的BitMap64類型適合表達具有特定關(guān)系的大量實體ID的集合,將集合的交并補運算轉(zhuǎn)化為bitmap之間的交并補運算,從而達到遠超普通查詢的性能指標(biāo)。

      那么,BitEngine如何應(yīng)用在人群圈選場景中?舉個例子,廣告主需求為圈選出“人群包A”和“人群包B”的交集人群,完成廣告精準(zhǔn)投放。

      人群包情況:

      ●人群包A = [10001, 20001,30001,40001,50001],人群包B = [10001, 20001,20002,20003,20004]

      期望結(jié)果: 

      ●通過BitEngine計算A&B = [10001, 20001]

      首先,人群包按照一定規(guī)則劃分為多個區(qū)間,任意兩個區(qū)間之間的人群包沒有交集,由BitEngine保障數(shù)據(jù)的讀取和計算是嚴(yán)格按照區(qū)間進行;其次,BitEngine在數(shù)據(jù)讀取時會為每一個文件構(gòu)建一個讀任務(wù),由一個線程調(diào)度模塊完成整個任務(wù)調(diào)度和讀取;最后,BitEngine完成所有中間結(jié)果計算后,按照結(jié)果的輸出要求做一次數(shù)據(jù)合并,由此完成交集計算。已上線業(yè)務(wù)的測試表明,相比普通和Array或者用戶表方式,BitEngine在查詢速度上有10-50倍提升。

      BitEngine上線前后查詢耗時監(jiān)控

      BitEngine不僅僅在抖音集團海量廣告投放場景中使用,目前更是集成在火山引擎云原生數(shù)據(jù)倉庫ByteHouse中對外輸出。火山引擎ByteHouse主要為用戶提供極速分析體驗,能夠支撐實時數(shù)據(jù)分析和海量數(shù)據(jù)離線分析,具備便捷的彈性擴縮容能力,極致分析性能和豐富的企業(yè)級特性,目前已經(jīng)與中國地震臺網(wǎng)中心、海王集團、莉莉絲游戲、極客邦科技等諸多行業(yè)企業(yè)達成合作,深度助力各個行業(yè)數(shù)字化轉(zhuǎn)型。(作者:陳升)

      推薦DIY文章
      當(dāng)智能健身走向全民化:AEKE輕力量家庭智能健身房引領(lǐng)未來
      海藝AI:迎合“AI時代”發(fā)展潮流,刷新繪圖市場傳統(tǒng)認(rèn)知
      布局產(chǎn)業(yè)新高地!海星醫(yī)藥健康創(chuàng)新園B區(qū)奠基儀式隆重舉行
      未來五年500億投入打底,北汽藍谷錨定細分市場增量
      【展會直擊】華秋慕尼黑上海電子展精彩ing,助力電子產(chǎn)業(yè)高質(zhì)量發(fā)展!
      桂花網(wǎng)藍牙網(wǎng)關(guān)助力司乘人員職業(yè)健康監(jiān)測
      精彩新聞

      超前放送

      免费电影网站网址入口,国产精品欧美激情第一页,欧美国产日韩做一线,欧美一区二区三区在线观看不卡
      <input id="yuqso"></input>
      <pre id="yuqso"><cite id="yuqso"></cite></pre>
      <acronym id="yuqso"><cite id="yuqso"></cite></acronym>
    • <s id="yuqso"><em id="yuqso"></em></s>
        <s id="yuqso"><em id="yuqso"></em></s>
        <bdo id="yuqso"></bdo>
        主站蜘蛛池模板: 中文字幕在线观看2020| 风间由美性色一区二区三区| bl文库双性灌尿| 人人爽天天爽夜夜爽曰| 精品999久久久久久中文字幕| 欧美jizz18性欧美| 妓女嫖客叫床粗话对白| 女性高爱潮有声视频| 国产又爽又黄又无遮挡的激情视频 | 蜜桃精品免费久久久久影院 | 日本xxxx裸体bbbb| 国产精品美女久久久久久2018| 国产69精品久久久久999小说| 亚洲国产成人在线视频| wtfpass欧美极品angelica| 香港特级a毛片免费观看| 日本在线观看www| 国产真实女人一级毛片| 亚洲熟妇av一区二区三区宅男| 两根硕大的挤进了小雪| 蒂法3d同人全肉动漫在线播放| 无码人妻一区二区三区在线| 国产在视频线精品视频| 亚洲另类春色校园小说| 97香蕉久久夜色精品国产| 精品三级内地国产在线观看| 大香网伊人久久综合观看| 午夜精品久久久久久久99热| 久久成人国产精品一区二区| 最新精品亚洲成a人在线观看| 瑟瑟网站免费网站入口| 嫩草伊人久久精品少妇av| 国产AV人人夜夜澡人人爽麻豆| 一级黄色片免费| 精品成人一区二区三区四区| 日本三级香港三级人妇99| 国产尤物在线视精品在亚洲| 五月开心播播网| 欧美freesex黑人又粗超长| 欧洲亚洲国产精华液| 国内自产少妇自拍区免费|