視覚と自然言語の融合研究(英語: Vision and Language)とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答(VQA)などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。

Property Value
dbo:abstract
  • 視覚と自然言語の融合研究(英語: Vision and Language)とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答(VQA)などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja)
  • 視覚と自然言語の融合研究(英語: Vision and Language)とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答(VQA)などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja)
dbo:thumbnail
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 4570399 (xsd:integer)
dbo:wikiPageLength
  • 46478 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 90260109 (xsd:integer)
dbo:wikiPageWikiLink
prop-en:caption
  • Visual ReasoningのデータセットであるCLEVRの画像の例。質問の例として「小さい円柱は金属製の物体より多いですか?」などが想定される(回答は「いいえ」)。 (ja)
  • Visual ReasoningのデータセットであるCLEVRの画像の例。質問の例として「小さい円柱は金属製の物体より多いですか?」などが想定される(回答は「いいえ」)。 (ja)
prop-en:imageLeft
  • 100 (xsd:integer)
prop-en:imageWidth
  • 250 (xsd:integer)
prop-en:width
  • 450 (xsd:integer)
prop-en:wikiPageUsesTemplate
dct:subject
rdfs:comment
  • 視覚と自然言語の融合研究(英語: Vision and Language)とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答(VQA)などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja)
  • 視覚と自然言語の融合研究(英語: Vision and Language)とは、コンピュータビジョンと自然言語処理を融合した研究分野である。画像や動画からのキャプション生成、画像や動画を対象とした質問応答(VQA)などのタスクが含まれる。 1960年代からの分野を中心に初期の研究が始められており、1990年代ごろから画像検索、2000年代から画像キャプション生成の研究も始められた。2010年代に深層学習の適用によってコンピュータビジョンと自然言語処理が大きく発展したことに伴い、融合研究も発展を遂げている。多くの研究が行われている一方で、データセットバイアスなどの研究課題も残されている。 (ja)
rdfs:label
  • 視覚と自然言語の融合研究 (ja)
  • 視覚と自然言語の融合研究 (ja)
prov:wasDerivedFrom
foaf:depiction
foaf:isPrimaryTopicOf
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is owl:sameAs of
is foaf:primaryTopic of