workflows/gen_ut/write_tests.py

from typing import List, Optional

import tiktoken

from chat.ask_codebase.tools.retrieve_file_content import retrieve_file_content
from openai_util import create_chat_completion_chunks
from prompts import WRITE_TESTS_PROMPT
from model import FuncToTest, TokenBudgetExceededException


MODEL = "gpt-4-1106-preview"
TOKEN_BUDGET = int(128000 * 0.9)


def _mk_write_tests_msg(
    root_path: str,
    func_to_test: FuncToTest,
    test_cases: List[str],
    chat_language: str,
    reference_files: Optional[List[str]] = None,
) -> Optional[str]:
    encoding: tiktoken.Encoding = tiktoken.encoding_for_model(MODEL)

    test_cases_str = ""
    for i, test_case in enumerate(test_cases, 1):
        test_cases_str += f"{i}. {test_case}\n"

    if reference_files:
        reference_tests_str = ""
        for i, fp in enumerate(reference_files, 1):
            reference_test_content = retrieve_file_content(fp, root_path)
            reference_tests_str += f"{i}. {fp}\n\n"
            reference_tests_str += f"```{reference_test_content}```\n"
    else:
        reference_tests_str = "No reference test cases provided."

    func_content = f"function code\n```\n{func_to_test.func_content}\n```\n"
    class_content = ""
    if func_to_test.container_content is not None:
        class_content = f"class code\n```\n{func_to_test.container_content}\n```\n"

    # Adjust relevant content to fit the token budget

    # 1. both func content and class content
    relevant_content = "\n".join([func_content, class_content])

    user_msg = WRITE_TESTS_PROMPT.format(
        function_name=func_to_test.func_name,
        file_path=func_to_test.file_path,
        relevant_content=relevant_content,
        test_cases_str=test_cases_str,
        chat_language=chat_language,
        reference_tests_str=reference_tests_str,
    )
    tokens = len(encoding.encode(user_msg))
    if tokens <= TOKEN_BUDGET:
        return user_msg

    # 2. only func content
    relevant_content = func_content
    user_msg = WRITE_TESTS_PROMPT.format(
        function_name=func_to_test.func_name,
        file_path=func_to_test.file_path,
        relevant_content=relevant_content,
        test_cases_str=test_cases_str,
        chat_language=chat_language,
        reference_tests_str=reference_tests_str,
    )
    tokens = len(encoding.encode(user_msg))
    if tokens <= TOKEN_BUDGET:
        return user_msg

    # 3. even func content exceeds the token budget
    raise TokenBudgetExceededException(
        f"Token budget exceeded while writing test cases for <{func_to_test}>. "
        f"({tokens}/{TOKEN_BUDGET})"
    )


def write_and_print_tests(
    root_path: str,
    func_to_test: FuncToTest,
    test_cases: List[str],
    reference_files: Optional[List[str]] = None,
    chat_language: str = "English",
) -> None:
    user_msg = _mk_write_tests_msg(
        root_path=root_path,
        func_to_test=func_to_test,
        test_cases=test_cases,
        reference_files=reference_files,
        chat_language=chat_language,
    )

    chunks = create_chat_completion_chunks(
        model=MODEL,
        messages=[{"role": "user", "content": user_msg}],
        temperature=0.1,
    )

    for chunk in chunks:
        if chunk.choices[0].finish_reason == "stop":
            break
        print(chunk.choices[0].delta.content, flush=True, end="")
Init /gen_ut 2023-12-18 20:46:16 +08:00			`from typing import List, Optional`

			`import tiktoken`

			`from chat.ask_codebase.tools.retrieve_file_content import retrieve_file_content`
Use create completion wrappers in propose_test and write_tests 2023-12-24 19:15:43 +08:00			`from openai_util import create_chat_completion_chunks`
Manage prompts in a single file and ignore line-too-long error 2023-12-24 19:43:29 +08:00			`from prompts import WRITE_TESTS_PROMPT`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`from model import FuncToTest, TokenBudgetExceededException`
Init /gen_ut 2023-12-18 20:46:16 +08:00

			`MODEL = "gpt-4-1106-preview"`
Update token budgets 2023-12-28 17:09:06 +08:00			`TOKEN_BUDGET = int(128000 * 0.9)`
Init /gen_ut 2023-12-18 20:46:16 +08:00

Output the final answer in streaming mode 2023-12-24 17:21:31 +08:00			`def _mk_write_tests_msg(`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`root_path: str,`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`func_to_test: FuncToTest,`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`test_cases: List[str],`
Support different languages in write_tests 2023-12-24 18:38:59 +08:00			`chat_language: str,`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`reference_files: Optional[List[str]] = None,`
Output the final answer in streaming mode 2023-12-24 17:21:31 +08:00			`) -> Optional[str]:`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`encoding: tiktoken.Encoding = tiktoken.encoding_for_model(MODEL)`

			`test_cases_str = ""`
			`for i, test_case in enumerate(test_cases, 1):`
			`test_cases_str += f"{i}. {test_case}\n"`

			`if reference_files:`
			`reference_tests_str = ""`
			`for i, fp in enumerate(reference_files, 1):`
Use relative path in inner logic 2023-12-24 20:13:30 +08:00			`reference_test_content = retrieve_file_content(fp, root_path)`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`reference_tests_str += f"{i}. {fp}\n\n"`
			reference_tests_str += f"```{reference_test_content}```\n"
			`else:`
			`reference_tests_str = "No reference test cases provided."`

Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			func_content = f"function code\n```\n{func_to_test.func_content}\n```\n"
			`class_content = ""`
			`if func_to_test.container_content is not None:`
			class_content = f"class code\n```\n{func_to_test.container_content}\n```\n"

			`# Adjust relevant content to fit the token budget`

			`# 1. both func content and class content`
			`relevant_content = "\n".join([func_content, class_content])`

Init /gen_ut 2023-12-18 20:46:16 +08:00			`user_msg = WRITE_TESTS_PROMPT.format(`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`function_name=func_to_test.func_name,`
			`file_path=func_to_test.file_path,`
			`relevant_content=relevant_content,`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`test_cases_str=test_cases_str,`
Support different languages in write_tests 2023-12-24 18:38:59 +08:00			`chat_language=chat_language,`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`reference_tests_str=reference_tests_str,`
			`)`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`tokens = len(encoding.encode(user_msg))`
			`if tokens <= TOKEN_BUDGET:`
			`return user_msg`
Init /gen_ut 2023-12-18 20:46:16 +08:00
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`# 2. only func content`
			`relevant_content = func_content`
			`user_msg = WRITE_TESTS_PROMPT.format(`
			`function_name=func_to_test.func_name,`
			`file_path=func_to_test.file_path,`
			`relevant_content=relevant_content,`
			`test_cases_str=test_cases_str,`
			`chat_language=chat_language,`
			`reference_tests_str=reference_tests_str,`
			`)`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`tokens = len(encoding.encode(user_msg))`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`if tokens <= TOKEN_BUDGET:`
			`return user_msg`
Init /gen_ut 2023-12-18 20:46:16 +08:00
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`# 3. even func content exceeds the token budget`
			`raise TokenBudgetExceededException(`
Improve the output of token budget exception 2023-12-28 16:40:42 +08:00			`f"Token budget exceeded while writing test cases for <{func_to_test}>. "`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`f"({tokens}/{TOKEN_BUDGET})"`
			`)`
Output the final answer in streaming mode 2023-12-24 17:21:31 +08:00

			`def write_and_print_tests(`
			`root_path: str,`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`func_to_test: FuncToTest,`
Output the final answer in streaming mode 2023-12-24 17:21:31 +08:00			`test_cases: List[str],`
			`reference_files: Optional[List[str]] = None,`
Support different languages in write_tests 2023-12-24 18:38:59 +08:00			`chat_language: str = "English",`
Use relative path in inner logic 2023-12-24 20:13:30 +08:00			`) -> None:`
Output the final answer in streaming mode 2023-12-24 17:21:31 +08:00			`user_msg = _mk_write_tests_msg(`
			`root_path=root_path,`
Adjust content to fit token budget and handle budget exceeded exception 2023-12-28 15:56:15 +08:00			`func_to_test=func_to_test,`
Output the final answer in streaming mode 2023-12-24 17:21:31 +08:00			`test_cases=test_cases,`
			`reference_files=reference_files,`
Support different languages in write_tests 2023-12-24 18:38:59 +08:00			`chat_language=chat_language,`
Init /gen_ut 2023-12-18 20:46:16 +08:00			`)`
Output the final answer in streaming mode 2023-12-24 17:21:31 +08:00
Use create completion wrappers in propose_test and write_tests 2023-12-24 19:15:43 +08:00			`chunks = create_chat_completion_chunks(`
			`model=MODEL,`
			`messages=[{"role": "user", "content": user_msg}],`
			`temperature=0.1,`
			`)`
Init /gen_ut 2023-12-18 20:46:16 +08:00
Use create completion wrappers in propose_test and write_tests 2023-12-24 19:15:43 +08:00			`for chunk in chunks:`
			`if chunk.choices[0].finish_reason == "stop":`
			`break`
			`print(chunk.choices[0].delta.content, flush=True, end="")`