Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations
์ด ๋ ผ๋ฌธ์ ์ฒ์ ์๊ฒ ๋ ๊ฒ์ ์ ๋ฒ๋ฌ์ Google Brain์์ Tensorflow Recommenders ๋ผ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ณต๊ฐํ๋ฉด์ ์ ๋๋ค. Youtube๋ผ๋ ๊ฑฐ๋ํ ์ถ์ฒ์์คํ ์ ์ด์ํ๊ณ ์๋ ๊ตฌ๊ธ์ด ์ถ์ฒ ์์คํ ๊ด๋ จ ์ฝ๋๋ฅผ ๊ณต๊ฐํ๋ค๊ณ ํด์ ์ง์คํด์ ๋ณด๊ฒ ๋์์ต๋๋ค. ์ ์ฒด์ ์ธ ๋ด์ฉ์ Tensorflow Blog์ ๋ ์์ธํ ๋์์์ผ๋ ์ฝ์ด๋ณด์๊ธฐ ๋ฐ๋๋๋ค. TFRS(TensorFlow Recommeners)์ ๋ชฉํ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์ถ์ฒ ํ๋ณด๊ตฐ์ ๋น ๋ฅด๊ณ ์ ์ฐํ๊ฒ ๋น๋ Item, User, Context ์ ๋ณด๋ฅผ ์์ ๋กญ๊ฒ ์ฌ์ฉํ๋ ๊ตฌ์กฐ ๋ค์ํ objective๋ฅผ ๋์์ ํ์ตํ๋ multi-task ๊ตฌ์กฐ ํ์ต๋ ๋ชจ๋ธ์ TF Serving์ผ๋ก ํจ์จ์ ์ผ๋ก ์๋น ์ฌ์ค ์ฝ๋ ์์ฒด๋ ํฌ๊ฒ ๋ค์ํ ๋ด์ฉ๋ค์ด ์์ง๋ ์์์ง๋ง, ์ ์ผ ์ธ์ ๊น์๋ ๊ฒ์ ์ฝ๋์์ ๊ธฐ๋ณธ ๋ชจ๋ธ๋ก ์๊ฐํ Two Tower Model์ด์์ต๋๋ค. ๋ฐ๋ก User์ Item์ ์์ ๋ ๋ฆฝ์ ์ผ๋ก ํ์ต์์ผ ๋ง์ง๋ง ๋จ์์ dot product๋ก๋ง click / unclick์ ์์ธกํ๋ ๊ฒ์ธ๋ฐ, ์๊ฐํ๋ฉด ์๊ฐํ ์๋ก ์ข์ ๊ตฌ์กฐ๋๋ผ๊ตฌ์. ๋น๋ก ํ์ตํ๋ ๋จ์์ user tower์ item tower๊ฐ interact ๋ชปํ๊ธฐ ๋๋ฌธ์ ์์ฒญ๋ ์ฑ๋ฅ์ ๋ผ ์ง๋ ๋ฏธ์ง์์์ง๋ง, ๊ตฌ์กฐ ์์ฒด๊ฐ input feature์ ์ ์ฝ์ด ์์ด์ ๊ฐ๋ฅํ feature๋ฅผ ์์ ๋กญ๊ฒ ๋ฃ์ ์ ์์๊ณ , inferenceํ ๋๋ user๋ณ embedding, item๋ณ embedding์ผ๋ก ๊ฐ์ง๊ณ ์๋ค๊ฐ dot product๋ก๋ง similarity๋ฅผ ๊ณ์ฐํด์ servingํ ์ ์๊ธฐ ๋๋ฌธ์ ANN(Approximate Nearest Neighbors) ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ํธํ์ฑ๋ ์ข์ ๋ณด์์ต๋๋ค. ...