Computer Vision

Python, Computer Vision, AI, Transhumanism 関連

Stable Diffusionによるいらすとや変換

いらすとやがオープンでフリーなイラスト素材を大量に放出した事により、近年の日本では、様々な掲示や資料に「いらすとや」のイラストが利用されている。

 

いらすとやのイラストは、様々なパターンがあり、使いやすい点はよいのだが、若干脱力感高めなので、もう少し真面目な資料にあわせたイラストが欲しい事もあるかと思う。

 

そこで今回はいらすとやの画像を、Stable Diffusionのimg2imgで変換してみる。

まずは蛙男。

蛙男

frog boy

それなりに意図通りの変換ができたと思う。

 

続いてロボット

 

ロボット

ハートを持ったロボット

 

プロンプトのほうは

illustration,simple,japan,robot with heart

ネガティブプロンプトは

3D,photo

を使って変換している。

 

それぞれ、 使用した生成モデルは Chilloutmix-Ni-pruned-fp32-fix

 

プロンプトの英語キーワードについては、Google翻訳なり、DeepL翻訳なりを使ったら良いと思う。

 

生成の背景が黒くなっているのは、いらすとやの素材が背景を透明にしてくれているからなのだが、気になる場合は、後から白背景に補正するか、元画像を背景白にすればよいかと思う。尚、試しに「background white」を入れてみたが、それはダメだった。

 

プロンプトに「japan」を入れているのは、日本ぽいイラストにしたいという意図。

時々、中国っぽくなったり、古来の日本カルチャーを意識したようなものになるが、その辺はAIの学習している要素のバイアスによるものなのだろう。

 

以上、いらすとや変換でした。

最初からプロントで生成してもよいパターンもあるだろうが、同じプロンプトで生成した例はこちら

まあ、海外風なイラストになるので、いらすとやの構図と、テイストを持ちつつも、少しだけ、いらすとや感を抜きたいときは、前述の手法が良いかと思う。

 

尚、Stable Diffusionの商用利用については、いくつかのモデルがありそれによっては、商用利用での微妙なので、ご注意ください。

 

また、著作権に関しては、線引きがあいまいな所があるという所も補足しておきたいと思います。(わかりやすい例としては、ミッキーマウスを生成させて、ミッキーマウスっぽいものができたとして、それをミッキーマウスとして掲示したり、販売するとアウトになるという場合とか。)

 

まあ最終的には、著作権診断AIみたいなのが組み込まれて、それがチェックしたら、基本的にはOKになるといいなと思っている。実際、Adobe Fireflyもそんなロジックで運用されているのかと勝手に思っている。