Maas2-group
/
maas-base


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176
							import pytest
from gpustack.routes.model_sets import filter_specs_by_gpu
from gpustack.schemas.gpu_devices import GPUDevice
from gpustack.schemas.model_sets import GPUFilters, ModelSpec
from gpustack.schemas.models import SourceEnum


def make_model_spec(**kwargs):
    return ModelSpec(
        source=SourceEnum.HUGGING_FACE, huggingface_repo_id="Qwen/Qwen3-0.6B", **kwargs
    )


@pytest.mark.parametrize(
    "case_name, gpus, model_specs, filtered_specs_expected",
    [
        (
            "filter by gpu vendor",
            [
                GPUDevice(vendor="nvidia", compute_capability="8.0"),
            ],
            [
                make_model_spec(
                    mode="standard", gpu_filters=GPUFilters(vendor=["nvidia"])
                ),
                make_model_spec(
                    mode="standard", gpu_filters=GPUFilters(vendor=["amd"])
                ),
            ],
            [
                make_model_spec(
                    mode="standard", gpu_filters=GPUFilters(vendor=["nvidia"])
                ),
            ],
        ),
        (
            "filter by gpu vendor ascend",
            [
                GPUDevice(vendor="ascend"),
            ],
            [
                make_model_spec(
                    mode="standard", gpu_filters=GPUFilters(vendor=["nvidia"])
                ),
                make_model_spec(
                    mode="standard", gpu_filters=GPUFilters(vendor=["ascend"])
                ),
                make_model_spec(
                    mode="throughput", gpu_filters=GPUFilters(vendor=["ascend"])
                ),
            ],
            [
                make_model_spec(
                    mode="throughput", gpu_filters=GPUFilters(vendor=["ascend"])
                ),
                make_model_spec(
                    mode="standard", gpu_filters=GPUFilters(vendor=["ascend"])
                ),
            ],
        ),
        (
            "filter by gpu vendor and compute capability",
            [
                GPUDevice(vendor="nvidia", compute_capability="7.0"),
            ],
            [
                make_model_spec(
                    mode="standard",
                    gpu_filters=GPUFilters(
                        vendor=["nvidia"], compute_capability=">=7.0"
                    ),
                ),
                make_model_spec(
                    mode="standard",
                    gpu_filters=GPUFilters(vendor=["amd"], compute_capability=">=7.0"),
                ),
                make_model_spec(
                    mode="throughput",
                    gpu_filters=GPUFilters(
                        vendor=["nvidia"], compute_capability=">=8.0"
                    ),
                ),
                make_model_spec(
                    mode="latency",
                    gpu_filters=GPUFilters(
                        vendor=["nvidia"], compute_capability=">=7.0,<=9.0"
                    ),
                ),
            ],
            [
                make_model_spec(
                    mode="latency",
                    gpu_filters=GPUFilters(
                        vendor=["nvidia"], compute_capability=">=7.0,<=9.0"
                    ),
                ),
                make_model_spec(
                    mode="standard",
                    gpu_filters=GPUFilters(
                        vendor=["nvidia"], compute_capability=">=7.0"
                    ),
                ),
            ],
        ),
        (
            "filter by gpu vendor and CANN variant",
            [
                GPUDevice(vendor="ascend", arch_family="Ascend910B2"),
            ],
            [
                make_model_spec(
                    mode="standard",
                    gpu_filters=GPUFilters(vendor=["nvidia"]),
                ),
                make_model_spec(
                    mode="standard",
                    gpu_filters=GPUFilters(vendor=["ascend"], vendor_variant="310p"),
                ),
                make_model_spec(
                    mode="standard",
                    gpu_filters=GPUFilters(vendor=["ascend"], vendor_variant="910b"),
                ),
                make_model_spec(
                    mode="throughput",
                    gpu_filters=GPUFilters(vendor=["ascend"], vendor_variant="310p"),
                ),
                make_model_spec(
                    mode="latency",
                    gpu_filters=GPUFilters(vendor=["ascend"], vendor_variant="910b"),
                ),
                make_model_spec(
                    mode="any-ascend",
                    gpu_filters=GPUFilters(vendor=["ascend"]),
                ),
            ],
            [
                make_model_spec(
                    mode="latency",
                    gpu_filters=GPUFilters(vendor=["ascend"], vendor_variant="910b"),
                ),
                make_model_spec(
                    mode="standard",
                    gpu_filters=GPUFilters(vendor=["ascend"], vendor_variant="910b"),
                ),
                make_model_spec(
                    mode="any-ascend",
                    gpu_filters=GPUFilters(vendor=["ascend"]),
                ),
            ],
        ),
        (
            "no gpu filters",
            [
                GPUDevice(vendor="amd", compute_capability=None),
            ],
            [
                make_model_spec(mode="standard", gpu_filters=None),
                make_model_spec(
                    mode="throughput", gpu_filters=GPUFilters(vendor=["nvidia"])
                ),
            ],
            [
                make_model_spec(mode="standard", gpu_filters=None),
            ],
        ),
    ],
)
def test_filter_specs_by_gpu(
    config, case_name, gpus, model_specs, filtered_specs_expected
):
    try:
        actual_specs = filter_specs_by_gpu(gpus, model_specs)
        assert actual_specs == filtered_specs_expected
    except AssertionError as e:
        print(f"Test case '{case_name}' failed.")
        raise e