بسم الله الرحمن الرحیم
سلام
آرایه A یک بار ساخته میشه و در آن k همسایه هایی که بیشترین شباهت رو به متن تست دارن نگهداری میکنه. اول همه سند ها رو با مقدار شباهت ها تا جایی که آرایه پر بشه توی اون قرار میده. بعدش برای بقیه سندها هر بار مقدار شباهت رو بدست میاره و اگر از کم ترین مقدار شباهتی که توی آرایه هست بیشتر بود اون کم ترین رو بیرون میندازه و این رو جایگزین میکنه. اینجوری در نهایت داخل آرایه k سندی که بیشترین شباهت رو دارن میمونن.
اما این که چرا چک میکنه مقدار tfها بزرگتر از حداقل شباهت سند داخل آرایه باشه، دقیق نمیدونم ولی فکر میکنم چون اگر کم تر باشه محال خواهد بود که شباهت اون سند بیشتر از کم ترین مقدار شباهت در آرایه بشه.
توی متن توضیح نداده که فرمول شباهت کسینوسی رو با چه مقادیری اعمال میکنه؟
میشه فرمول دقیق محاسبه شباهت بین دو تا سند رو بیارید؟
ممنون
|