Spaces:

Sparkles-AI
/

design-look-a-likes

Running on T4

App Files Files Community

koenverhagen commited on Apr 25, 2023

Commit

0b89ddd

•

1 Parent(s): 79f0df2

int

Browse files

Files changed (6) hide show

.gitignore +4 -0
Dockerfile +12 -0
createlookalike.py +160 -0
requirements.txt +38 -0
server.py +17 -0
state.json +1 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,4 @@

+venv
+*.iml
+*.xml
+.idea

Dockerfile ADDED Viewed

	@@ -0,0 +1,12 @@

+FROM tensorflow/tensorflow:2.10.0-gpu
+WORKDIR /app
+RUN mkdir -p shops
+COPY ./requirements.txt /requirements.txt
+RUN pip install --no-cache-dir --upgrade -r /requirements.txt
+CMD ["uvicorn", "app.server:app", "--host", "0.0.0.0", "--port", "7860"]

createlookalike.py ADDED Viewed

	@@ -0,0 +1,160 @@

+import tempfile as tfile
+from datetime import datetime
+from urllib.request import urlopen
+import requests
+from keras.utils import img_to_array
+from lxml import etree
+import keras
+from keras.applications.imagenet_utils import decode_predictions, preprocess_input
+from keras.models import Model
+from PIL import Image
+from io import BytesIO
+import numpy as np
+from sklearn.decomposition import PCA
+from scipy.spatial import distance
+from collections import OrderedDict
+from remove import remove_files
+from generate_csv_file import generate_csv_files
+from load_data import load_data, get_shops
+def get_ids_from_feed(feed_url):
+    # create temp xml file
+    temp_file = tfile.NamedTemporaryFile(mode="w", suffix=".xml", prefix="feed")
+    f = temp_file.name
+    temp_file.write(urlopen(feed_url).read().decode('utf-8'))
+    # open xml file
+    tree = etree.parse(f)
+    temp_file.close()
+    root = tree.getroot()
+    # get image ids and shop base url
+    list_ids = []
+    shop_url = root[0][1].text
+    for item in root.findall(".//g:mpn", root.nsmap):
+        list_ids.append(item.text)
+    return list_ids, shop_url
+def get_image(url):
+    res = requests.get(url)
+    im = Image.open(BytesIO(res.content)).convert("RGB").resize((224, 224))
+    img = img_to_array(im)
+    x = img_to_array(img)
+    x = np.expand_dims(x, axis=0)
+    x = preprocess_input(x)
+    return img, x
+def load_image(url, img_id):
+    print('get image url', id)
+    request_url = '{}/flat_thumb/{}/1/224'.format(url, img_id)
+    print('get image', request_url)
+    img, x = get_image(request_url)
+    return img, x
+def create_feature_files():
+    model = keras.applications.VGG16(weights='imagenet', include_top=True)
+    feat_extractor = Model(inputs=model.input, outputs=model.get_layer("fc2").output)
+    final_json = []
+    data = get_shops()
+    if data:
+        for p in data:
+            final_json.append(calculate_shop(p, feat_extractor))
+        load_data(generate_csv_files(final_json))
+        remove_files()
+    return
+def calculate_shop(shop, feat_extractor):
+    start = datetime.today()
+    if shop['id'] not in ['']:  # temp
+        print(shop['id'], shop['base_url'])
+        google_xml_feed_url = '{}/google_xml_feed'.format(shop['base_url'])
+        try:
+            list_ids, shop_url = get_ids_from_feed(google_xml_feed_url)
+        except Exception as e:
+            list_ids = []
+            print('could not get images from ', shop['id'], e)
+        features = []
+        list_of_fitted_designs = []
+        design_json = {}
+        if len(list_ids) > 0:
+            for l in list_ids:
+                try:
+                    img, x = load_image(shop_url, l)
+                    feat = feat_extractor.predict(x)[0]
+                    features.append(feat)
+                    list_of_fitted_designs.append(l)
+                except Exception as e:
+                    print(l, ' failed loading feature extraction', e)
+            try:
+                features = np.array(features)
+                # print(features.shape)
+                components = len(features) if len(features) < 300 else 300
+                pca = PCA(n_components=components)  # 300
+                pca.fit(features)
+                pca_features = pca.transform(features)
+            except Exception as e:
+                print('pca too small?', e)
+            if len(list_of_fitted_designs) >= 80:
+                max_list_per_design = 80
+            else:
+                max_list_per_design = len(list_of_fitted_designs)
+            try:
+                for im in list_of_fitted_designs:
+                    query_image_idx = list_of_fitted_designs.index(im)
+                    similar_idx = [distance.cosine(pca_features[query_image_idx], feat) for feat in pca_features]
+                    filterd_idx = dict()
+                    for i in range(len(similar_idx)):
+                        filterd_idx[i] = {"dist": similar_idx[i], "id": list_of_fitted_designs[i]}
+                    sorted_dict = dict(
+                        OrderedDict(sorted(filterd_idx.items(), key=lambda i: i[1]['dist'])[1:max_list_per_design]))
+                    design_list = []
+                    for k, v in sorted_dict.items():
+                        design_list.append(v)
+                    design_dict = {im: design_list}
+                    # idx_closest = sorted(range(len(similar_idx)), key=lambda k: similar_idx[k])
+                    design_json.update(design_dict)
+                    # print(idx_closest)
+            except Exception as e:
+                print("could not create json with look-a-like for shop:", shop['id'], e)
+        end = datetime.today()
+        return {'shop_id': shop['id'], 'start_time': start, 'end_time': end, 'designs': design_json}

requirements.txt ADDED Viewed

	@@ -0,0 +1,38 @@

+joblib==1.2.0
+keras==2.10.0
+lxml==4.9.1
+numpy==1.23.4
+scikit-learn==1.1.3
+scipy==1.9.3
+keras==2.10.0
+Pillow==9.2.0
+pandas==1.5.1
+requests==2.28.1
+python-multipart==0.0.5
+matplotlib==3.6.1
+scikit-image==0.19.3
+six==1.16.0
+termcolor==2.0.1
+tensorboard==2.12.1
+tensorboard-data-server==0.6.1
+tensorboard-plugin-wit==1.8.1
+tensorflow-estimator==2.12.0
+threadpoolctl==3.1.0
+tifffile==2022.10.10
+typing_extensions==4.4.0
+google-auth==2.13.0
+google-auth-oauthlib==0.4.6
+google-pasta==0.2.0
+fastapi==0.66.0
+python-multipart==0.0.5
+uvicorn==0.14.0
+tensorflow==2.12.0

server.py ADDED Viewed

	@@ -0,0 +1,17 @@

+from fastapi import FastAPI, Response, Request, Header, Form, UploadFile, Body
+from starlette.middleware.cors import CORSMiddleware
+from pydantic import BaseModel
+import json
+from load_data import get_design_data, get_design_resolutions_for_shop
+app = FastAPI()
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],  # Allows all origins
+    allow_credentials=True,
+    allow_methods=["*"],  # Allows all methods
+    allow_headers=["*"],  # Allows all headers
+)
+# API_TOKEN = os.environ["API_TOKEN"]
+API_TOKEN = '34dsadfF$$%#$TGREGEFGE%Q*)(*&%'

state.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"state": 0}