Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations
์ด ๋ ผ๋ฌธ์ ์ฒ์ ์๊ฒ ๋ ๊ฒ์ ์ ๋ฒ๋ฌ์ Google Brain์์ Tensorflow Recommenders ๋ผ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ณต๊ฐํ๋ฉด์ ์ ๋๋ค. Youtube๋ผ๋ ๊ฑฐ๋ํ ์ถ์ฒ์์คํ ์ ์ด์ํ๊ณ ์๋ ๊ตฌ๊ธ์ด ์ถ์ฒ ์์คํ ๊ด๋ จ ์ฝ๋๋ฅผ ๊ณต๊ฐํ๋ค๊ณ ํด์ ์ง์คํด์ ๋ณด๊ฒ ๋์์ต๋๋ค. ์ ์ฒด์ ์ธ ๋ด์ฉ์ Tensorflow Blog์ ๋ ์์ธํ ๋์์์ผ๋ ์ฝ์ด๋ณด์๊ธฐ ๋ฐ๋๋๋ค. TFRS(TensorFlow Recommeners)์ ๋ชฉํ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์ถ์ฒ ํ๋ณด๊ตฐ์ ๋น ๋ฅด๊ณ ์ ์ฐํ๊ฒ ๋น๋ Item, User, Context ์ ๋ณด๋ฅผ ์์ ๋กญ๊ฒ ์ฌ์ฉํ๋ ๊ตฌ์กฐ ๋ค์ํ objective๋ฅผ ๋์์ ํ์ตํ๋ multi-task ๊ตฌ์กฐ ํ์ต๋ ๋ชจ๋ธ์ TF Serving์ผ๋ก ํจ์จ์ ์ผ๋ก ์๋น ์ฌ์ค ์ฝ๋ ์์ฒด๋ ํฌ๊ฒ ๋ค์ํ ๋ด์ฉ๋ค์ด ์์ง๋ ์์์ง๋ง, ์ ์ผ ์ธ์ ๊น์๋ ๊ฒ์ ์ฝ๋์์ ๊ธฐ๋ณธ ๋ชจ๋ธ๋ก ์๊ฐํ Two Tower Model์ด์์ต๋๋ค. ๋ฐ๋ก User์ Item์ ์์ ๋ ๋ฆฝ์ ์ผ๋ก ํ์ต์์ผ ๋ง์ง๋ง ๋จ์์ dot product๋ก๋ง click / unclick์ ์์ธกํ๋ ๊ฒ์ธ๋ฐ, ์๊ฐํ๋ฉด ์๊ฐํ ์๋ก ์ข์ ๊ตฌ์กฐ๋๋ผ๊ตฌ์. ๋น๋ก ํ์ตํ๋ ๋จ์์ user tower์ item tower๊ฐ interact ๋ชปํ๊ธฐ ๋๋ฌธ์ ์์ฒญ๋ ์ฑ๋ฅ์ ๋ผ ์ง๋ ๋ฏธ์ง์์์ง๋ง, ๊ตฌ์กฐ ์์ฒด๊ฐ input feature์ ์ ์ฝ์ด ์์ด์ ๊ฐ๋ฅํ feature๋ฅผ ์์ ๋กญ๊ฒ ๋ฃ์ ์ ์์๊ณ , inferenceํ ๋๋ user๋ณ embedding, item๋ณ embedding์ผ๋ก ๊ฐ์ง๊ณ ์๋ค๊ฐ dot product๋ก๋ง similarity๋ฅผ ๊ณ์ฐํด์ servingํ ์ ์๊ธฐ ๋๋ฌธ์ ANN(Approximate Nearest Neighbors) ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ํธํ์ฑ๋ ์ข์ ๋ณด์์ต๋๋ค. ...
Multi Armed Bandit
์ต๊ทผ Recommendar System์ ๋ํด ๊ณต๋ถํ๋ฉด์, Multi-armed bandit์ด๋ผ๋ ๋ถ์ผ์ ๋ํด ๊ณต๋ถํ ํ์๊ฐ ์๋ค๊ณ ์๊ฐํ๋ ์ฐจ์ A Survey of Online Experiment Design with the Stochastic Multi-Armed Bandit์ ๋ฐํ์ผ๋ก ์ ๋ฆฌํด๋ณด์์ต๋๋ค. ๋ชฉ์ฐจ 1. Concept 2. MAB์ ๊ธฐ์กด ํต๊ณ ๊ธฐ๋ฐ ๋ชจ๋ธ๋ค๊ณผ์ ์ฐจ์ด์ 1. Concept Multi-armed Bandit(์ดํ MAB)๋ผ๋ ๋จ์ด๊ฐ ๋์ค๊ฒ ๋ ๋ฐฐ๊ฒฝ์ ๊ฒ๋ธ๋ง์ ๋๋ค. ์ด๋ค ์ฌ๋์ด ์ฃผ์ด์ง ์๊ฐ์์, ์์ต ๋ถํฌ๊ฐ ๋ค ๋ค๋ฅธ N๊ฐ์ ์ฌ๋กฏ๋จธ์ ์ ํตํด ์ต๋์ ์์ต์ ์ป๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ผ๊น์? ๋ง์ฝ ์ ํ๋ ์๊ฐ์ N๊ฐ์ ์ฌ๋กฏ๋จธ์ ๋ค์ ๋น๊ฒจ์ ์์ต์ ์ป์ ์ ์๋ ๊ธฐํ๊ฐ ์ฃผ์ด์ง๋ค๋ฉด, ์ผ๋จ์ ์ด๋ ์๊ฐ ๋์์ ์ด๋ ์ฌ๋กฏ ๋จธ์ ์ด ๋์ ๋ง์ด ์ป์ ์ ์๋ ์ง ํ์ํ๋ ๊ณผ์ ์ด ์์ด์ผ ํ ๊บผ๊ณ (์ด๋ฅผ Exploration์ด๋ผ๊ณ ํฉ๋๋ค), ๊ทธ ๋ค์์๋ ์์ ์ด ํ๋จํ๊ธฐ์ ๊ด์ฐฎ์ ์ฌ๋กฏ ๋จธ์ ์ ๋๋ฆฌ๋ฉด์ ์์ต์ ๊ทน๋ํํ๋ ๊ณผ์ ์ด ํ์ํฉ๋๋ค(์ด๋ฅผ Exploitation์ด๋ผ๊ณ ํฉ๋๋ค). ...
Attention in NLP
์ด ๊ธ์์๋ attention์ด ๋ฌด์์ธ์ง, ๋ช ๊ฐ์ ์ค์ํ ๋ ผ๋ฌธ๋ค์ ์ค์ฌ์ผ๋ก ์ ๋ฆฌํ๊ณ NLP์์ ์ด๋ป๊ฒ ์ฐ์ด๋ ์ง๋ฅผ ์ ๋ฆฌํด๋ณด์์ต๋๋ค. ๋ชฉ์ฐจ ๊ธฐ์กด Encoder-Decoder ๊ตฌ์กฐ์์ ์๊ธฐ๋ ๋ฌธ์ Basic Idea Attention Score Functions What Do We Attend To? Multi-headed Attention Transformer ๊ธฐ์กด Encoder-Decoder ๊ตฌ์กฐ์์ ์๊ธฐ๋ ๋ฌธ์ Encoder-Decoder ๊ตฌ์กฐ์์ ๊ฐ์ฅ ์ค์ํ ๋ถ๋ถ์ input sequence๋ฅผ ์ด๋ป๊ฒ vectorํํ ๊ฒ์ด๋๋ ๋ฌธ์ ์ ๋๋ค. ํนํ NLP์์๋ input sequence์ด๊ฐ dynamicํ ๊ตฌ์กฐ์ผ ๋๊ฐ ๋ง์ผ๋ฏ๋ก, ์ด๋ฅผ ๊ณ ์ ๋ ๊ธธ์ด์ ๋ฒกํฐ๋ก ๋ง๋ค๋ฉด์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ์ฆ, โ์๋ โ ์ด๋ผ๋ ๋ฌธ์ฅ์ด๋ โ์ค๋ ๋ ์จ๋ ์ข๋๋ฐ ๋ฏธ์ธ๋จผ์ง๋ ์ฌํ๋๊น ๋๊ฐ ๋ ๋ง์คํฌ ๊ผญ ์ฐ๊ณ ๋๊ฐ๋ ด!โ ์ด๋ผ๋ ๋ฌธ์ฅ์ด ๋ด๊ณ ์๋ ์ ๋ณด์ ์์ด ๋งค์ฐ ๋ค๋ฆ์๋ encoder-decoder๊ตฌ์กฐ์์๋ ๊ฐ์ ๊ธธ์ด์ vector๋ก ๋ฐ๊ฟ์ผ ํ์ฃ . Attention์ ๊ทธ ๋จ์ด์์ ์ ์ ์๋ ๊ฒ์ฒ๋ผ, sequence data์์ ์ํฉ์ ๋ฐ๋ผ ์ด๋ ๋ถ๋ถ์ ํนํ ๋ ์ฃผ๋ชฉ์ ํด์ผํ๋ ์ง๋ฅผ ๋ฐ์ํจ์ผ๋ก์จ ์ ๋ณด ์์ค๋ ์ค์ด๊ณ ๋ ์ง๊ด์ ์ผ๋ก ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฒ์ ์ ์๋์์ต๋๋ค. ...