About: 視覚と自然言語の融合研究

Property	Value
dbo:abstract	視覚と自然言語の融合研究（英語: Vision and Language）とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答（VQA）などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja) 視覚と自然言語の融合研究（英語: Vision and Language）とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答（VQA）などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja)
dbo:thumbnail	wiki-commons:Special:FilePath/Vizwiz-vqa.png?width=300
dbo:wikiPageExternalLink	https://aclanthology.org/J12-1006%7Cjournal=Computational https://www.jair.org/index.php/jair/article/view/11688%7Cjournal=Journal https://www.sciencepubco.com/index.php/ijet/article/view/9231%7Cjournal=International https://dl.acm.org/doi/10.1145/1348246.1348248%7Cjournal=ACM https://mitpress.mit.edu/books/deep-learning%7Cpublisher=MIT https://www.hindawi.com/journals/mpe/2019/9658350/%7Cjournal=Mathematical https://aclanthology.org/D15-1021%7Cjournal=Proceedings https://doi.org/10.1007/s11042-021-11045-1%7Cjournal=Multimedia https://doi.org/10.1007/s11431-020-1647-3%7Cjournal=Science https://doi.org/10.1088/1742-6596/1748/4/042060%7Cjournal=Journal https://doi.org/10.1145/3295748%7Cjournal=ACM https://doi.org/10.1145/3505244%7Cjournal=ACM https://www.sciencedirect.com/science/article/pii/S0262885621000998%7Cjournal=Image https://www.sciencedirect.com/science/article/pii/S1077314217300772%7Cjournal=Computer https://www.sciencedirect.com/science/article/pii/S1319157820303360%7Cjournal=Journal https://www.sciencedirect.com/science/article/pii/S1566253521001512%7Cjournal=Information https://www.worldcat.org/oclc/1080249173%7Clocation=Cambridge, https://www.worldcat.org/oclc/213375806%7Cisbn=978-0-13-187321-6%7Coclc=213375806%7Cfirst=Daniel%7Clast=Jurafsky%7Cyear=2009%7Cpublisher=Prentice https://ieeexplore.ieee.org/abstract/document/8269806%7Cjournal=IEEE https://ieeexplore.ieee.org/document/9087226%7Cjournal=2020 https://ieeexplore.ieee.org/document/9285213%7Cjournal=IEEE https://ieeexplore.ieee.org/document/9716741/%7Cjournal=IEEE https://www.frontiersin.org/article/10.3389/frai.2019.00028%7Cjournal=Frontiers
dbo:wikiPageID	4570399 (xsd:integer)
dbo:wikiPageLength	46478 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	90260109 (xsd:integer)
dbo:wikiPageWikiLink	dbpedia-ja:Category:コンピュータビジョン dbpedia-ja:Category:ディープラーニング dbpedia-ja:Category:人工知能 dbpedia-ja:Category:機械学習 dbpedia-ja:Category:自然言語処理 dbpedia-ja:Flickr dbpedia-ja:F値_(評価指標) dbpedia-ja:ImageNet dbpedia-ja:ROUGE_(評価指標) dbpedia-ja:Transformer_(機械学習モデル) dbpedia-ja:YouTube dbpedia-ja:アダマール積 dbpedia-ja:アノテーション dbpedia-ja:クラウドソーシング dbpedia-ja:クリップアート dbpedia-ja:グラフ_(離散数学) dbpedia-ja:コンピュータ dbpedia-ja:コンピュータビジョン dbpedia-ja:サポートベクターマシン dbpedia-ja:スポーツカー dbpedia-ja:ソーシャルメディア dbpedia-ja:テクスチャ dbpedia-ja:ディープラーニング dbpedia-ja:データセット dbpedia-ja:データベース dbpedia-ja:ノーベル文学賞 dbpedia-ja:ヒューマンコンピュータインタラクション dbpedia-ja:プログラム_(コンピュータ) dbpedia-ja:ロボット dbpedia-ja:分類_(統計学) dbpedia-ja:動画 dbpedia-ja:単語の埋め込み dbpedia-ja:回帰型ニューラルネットワーク dbpedia-ja:川端康成 dbpedia-ja:形 dbpedia-ja:情報検索 dbpedia-ja:教師あり学習 dbpedia-ja:敵対的生成ネットワーク dbpedia-ja:検索エンジン dbpedia-ja:機械翻訳 dbpedia-ja:物体検出 dbpedia-ja:特徴量 dbpedia-ja:画像 dbpedia-ja:畳み込みニューラルネットワーク dbpedia-ja:積木 dbpedia-ja:自動車 dbpedia-ja:自動運転車 dbpedia-ja:自家用自動車 dbpedia-ja:自然言語 dbpedia-ja:自然言語処理 dbpedia-ja:色 dbpedia-ja:視覚障害者 dbpedia-ja:調和平均 dbpedia-ja:長・短期記憶 dbpedia-ja:雪国_(小説) dbpedia-ja:鳥類 dbpedia-ja:鷹 dbpedia-ja:質問応答システム dbpedia-ja:BERT_(言語モデル) dbpedia-ja:SHRDLU dbpedia-ja:ファイル:Image-captioning.png dbpedia-ja:ファイル:Room-to-room.jpg dbpedia-ja:ファイル:Visual-Dialog.png dbpedia-ja:ファイル:Visual-question-answering-based-on-question-attention-model.jpg dbpedia-ja:ファイル:Vizwiz-captions.png dbpedia-ja:ファイル:Vizwiz-vqa.png dbpedia-ja:ファイル:Precisionrecall.svg
prop-en:caption	Visual ReasoningのデータセットであるCLEVRの画像の例。質問の例として「小さい円柱は金属製の物体より多いですか？」などが想定される（回答は「いいえ」）。 (ja) Visual ReasoningのデータセットであるCLEVRの画像の例。質問の例として「小さい円柱は金属製の物体より多いですか？」などが想定される（回答は「いいえ」）。 (ja)
prop-en:imageLeft	100 (xsd:integer)
prop-en:imageWidth	250 (xsd:integer)
prop-en:width	450 (xsd:integer)
prop-en:wikiPageUsesTemplate	template-en:Cite_book template-en:Cite_journal template-en:Clear template-en:Efn template-en:Main template-en:Reflist template-en:Refnest template-en:Sfn template-en:仮リンク template-en:SfnRef template-en:Annotated_image
dct:subject	dbpedia-ja:Category:コンピュータビジョン dbpedia-ja:Category:ディープラーニング dbpedia-ja:Category:人工知能 dbpedia-ja:Category:機械学習 dbpedia-ja:Category:自然言語処理
rdfs:comment	視覚と自然言語の融合研究（英語: Vision and Language）とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答（VQA）などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja) 視覚と自然言語の融合研究（英語: Vision and Language）とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答（VQA）などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja)
rdfs:label	視覚と自然言語の融合研究 (ja) 視覚と自然言語の融合研究 (ja)
prov:wasDerivedFrom	http://ja.wikipedia.org/wiki/視覚と自然言語の融合研究?oldid=90260109&ns=0
foaf:depiction	wiki-commons:Special:FilePath/CLEVR1080.png wiki-commons:Special:FilePath/Image-captioning.png wiki-commons:Special:FilePath/Room-to-room.jpg wiki-commons:Special:FilePath/Visual-Dialog.png wiki-commons:Special:FilePath/Visual-question-answering-based-on-question-attention-model.jpg wiki-commons:Special:FilePath/Vizwiz-captions.png wiki-commons:Special:FilePath/Vizwiz-vqa.png wiki-commons:Special:FilePath/Precisionrecall.svg
foaf:isPrimaryTopicOf	http://ja.wikipedia.org/wiki/視覚と自然言語の融合研究
is dbo:wikiPageRedirects of	dbpedia-ja:Vision_and_Language
is dbo:wikiPageWikiLink of	dbpedia-ja:コンピュータビジョン dbpedia-ja:自然言語処理 dbpedia-ja:Vision_and_Language
is owl:sameAs of	dbpedia-wikidata:視覚と自然言語の融合研究
is foaf:primaryTopic of	http://ja.wikipedia.org/wiki/視覚と自然言語の融合研究