About: Tf-idf

Property	Value
dbo:abstract	情報検索の分野において、tf–idf (または、 TFIDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量（数値）である。また、tf-idfは情報検索や、テキストマイニング、におけるにもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究では、電子図書館におけるテキストベースのレコメンダシステムのうち83%がtf-idfを利用していたことがわかった。 tf-idfの重み付け手法を変形したものは、ユーザーのクエリ（検索ワード）から文書の適合性を得点化し、順位づけする際の中心的なツールとして、よく検索エンジンで用いられている。tf-idfは、自動要約や文書分類といった様々な分野において、によるフィルタリングを行うことでうまく動作できる。最もシンプルなの一つは、クエリに含まれる語ごとのtf-idfの和を計算することで実装される。たくさんのより洗練された順位付け関数はこのシンプルなモデルの変形となっている。 (ja) 情報検索の分野において、tf–idf (または、 TFIDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量（数値）である。また、tf-idfは情報検索や、テキストマイニング、におけるにもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究では、電子図書館におけるテキストベースのレコメンダシステムのうち83%がtf-idfを利用していたことがわかった。 tf-idfの重み付け手法を変形したものは、ユーザーのクエリ（検索ワード）から文書の適合性を得点化し、順位づけする際の中心的なツールとして、よく検索エンジンで用いられている。tf-idfは、自動要約や文書分類といった様々な分野において、によるフィルタリングを行うことでうまく動作できる。最もシンプルなの一つは、クエリに含まれる語ごとのtf-idfの和を計算することで実装される。たくさんのより洗練された順位付け関数はこのシンプルなモデルの変形となっている。 (ja)
dbo:thumbnail	wiki-commons:Special:FilePath/Plot_IDF_functions.png?width=300
dbo:wikiPageExternalLink	http://scgroup.hpclab.ceid.upatras.gr/scgroup/Projects/TMG/ http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfTransformer.html%23sklearn.feature_extraction.text.TfidfTransformer https://ecommons.cornell.edu/bitstream/1813/6721/1/87-881.pdf https://www.opinosis-analytics.com/knowledge-base/term-frequency-explained/ https://www.semanticscholar.org/paper/f6bbbf2cc785cf96019dcd9c41ab1801aad962dd http://www.codeproject.com/KB/IP/AnatomyOfASearchEngine1.aspx https://archive.org/details/introductiontomo00salt http://lucene.apache.org/core/3_6_1/api/all/org/apache/lucene/search/Similarity.html
dbo:wikiPageID	1041885 (xsd:integer)
dbo:wikiPageLength	19296 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	89221957 (xsd:integer)
dbo:wikiPageWikiLink	dbpedia-ja:1998年 dbpedia-ja:2001年 dbpedia-ja:Gensim dbpedia-ja:Okapi_BM25 dbpedia-ja:Scikit-learn dbpedia-ja:Apache_Lucene dbpedia-ja:Category:アルゴリズム dbpedia-ja:Category:自然言語処理 dbpedia-ja:ブール代数 dbpedia-ja:ベクトル空間モデル dbpedia-ja:ページランク dbpedia-ja:マグロウヒル・エデュケーション dbpedia-ja:レコメンダシステム dbpedia-ja:単語の埋め込み dbpedia-ja:名詞句 dbpedia-ja:対数スケール dbpedia-ja:常用対数 dbpedia-ja:引用分析 dbpedia-ja:情報検索 dbpedia-ja:情報理論 dbpedia-ja:情報量 dbpedia-ja:文書 dbpedia-ja:文書分類 dbpedia-ja:検索エンジン dbpedia-ja:比例 dbpedia-ja:潜在意味解析 dbpedia-ja:物体検出 dbpedia-ja:相互情報量 dbpedia-ja:確率分布 dbpedia-ja:確率空間 dbpedia-ja:確率論 dbpedia-ja:結合エントロピー dbpedia-ja:統計量 dbpedia-ja:自動要約 dbpedia-ja:自然言語処理 dbpedia-ja:適合性_(情報検索) dbpedia-ja:電子図書館 dbpedia-ja:Tf-idf dbpedia-ja:カルバック・ライブラー情報量 dbpedia-ja:コーパス dbpedia-ja:ジップの法則 dbpedia-ja:テキストマイニング dbpedia-ja:ヒューリスティクス dbpedia-ja:ビット dbpedia-ja:単語 dbpedia-ja:数値 dbpedia-ja:同時確率分布 dbpedia-ja:スムージング dbpedia-ja:ファイル:Plot_IDF_functions.png
prop-ja:wikiPageUsesTemplate	template-ja:Cite_book template-ja:Cite_journal template-ja:Clearright template-ja:Div_col template-ja:Div_col_end template-ja:Math template-ja:Mvar template-ja:Quote template-ja:Reflist template-ja:Rp template-ja:仮リンク template-ja:小文字
dct:subject	dbpedia-ja:Category:アルゴリズム dbpedia-ja:Category:自然言語処理
rdfs:comment	情報検索の分野において、tf–idf (または、 TFIDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量（数値）である。また、tf-idfは情報検索や、テキストマイニング、におけるにもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究では、電子図書館におけるテキストベースのレコメンダシステムのうち83%がtf-idfを利用していたことがわかった。 tf-idfの重み付け手法を変形したものは、ユーザーのクエリ（検索ワード）から文書の適合性を得点化し、順位づけする際の中心的なツールとして、よく検索エンジンで用いられている。tf-idfは、自動要約や文書分類といった様々な分野において、によるフィルタリングを行うことでうまく動作できる。 (ja) 情報検索の分野において、tf–idf (または、 TFIDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量（数値）である。また、tf-idfは情報検索や、テキストマイニング、におけるにもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究では、電子図書館におけるテキストベースのレコメンダシステムのうち83%がtf-idfを利用していたことがわかった。 tf-idfの重み付け手法を変形したものは、ユーザーのクエリ（検索ワード）から文書の適合性を得点化し、順位づけする際の中心的なツールとして、よく検索エンジンで用いられている。tf-idfは、自動要約や文書分類といった様々な分野において、によるフィルタリングを行うことでうまく動作できる。 (ja)
rdfs:label	Tf-idf (ja) Tf-idf (ja)
owl:sameAs	freebase:Tf-idf
prov:wasDerivedFrom	wikipedia-ja:Tf-idf?oldid=89221957&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Plot_IDF_functions.png
foaf:isPrimaryTopicOf	wikipedia-ja:Tf-idf
is dbo:wikiPageDisambiguates of	dbpedia-ja:IDF
is dbo:wikiPageRedirects of	dbpedia-ja:TFIDF
is dbo:wikiPageWikiLink of	dbpedia-ja:Gensim dbpedia-ja:IDF dbpedia-ja:Okapi_BM25 dbpedia-ja:Statistically_Improbable_Phrases dbpedia-ja:ベクトル空間モデル dbpedia-ja:全文検索 dbpedia-ja:文書分類 dbpedia-ja:概念検索 dbpedia-ja:潜在意味解析 dbpedia-ja:Tf-idf dbpedia-ja:Trustedsource dbpedia-ja:りんな_(人工知能) dbpedia-ja:クロアチア語版ウィキペディア dbpedia-ja:タグクラウド dbpedia-ja:TFIDF
is owl:sameAs of	dbpedia-wikidata:Tf-idf
is foaf:primaryTopic of	wikipedia-ja:Tf-idf